括弧でくくる: Sample 4: テイラー展開(FORTRAN)

高速化プログラミング   
トップ  >  演算数と高速化  >  括弧でくくる  >  Sample 4: テイラー展開(FORTRAN)

括弧でくくる: Sample 4: テイラー展開(FORTRAN)

言語の変更:   C版

■ 概要

テイラー展開とは三角関数や指数関数のような複雑な関数を多項式に近似させる手段です。三角関数や指数関数はほとんどのプログラム言語で組み込み関数として用意されているので、実際のプログラミングではあまり使われないかもしれません。しかしベッセル関数などの、より複雑な関数となると、組み込み関数としてほとんどの言語にないので、自力でそのテイラー展開を求めてコーディングしなければなりません。

このサンプルでは式(1)に示すsin(x)のテイラー展開を例にして挙げます。べき数は掛け算の繰り返しなので、式(1)のままで計算すると掛け算の回数は3+5+7+9=24です。括弧を駆使すれば、掛け算の回数が半分以下に減らせます。

y=x-x^3/6+x^5/120-x^7/5040           ... 式(1)

下の「回答例」ボタンをクリックすれば、式(2)に回答例が表示されます。興味がある方はクリックする前にぜひ考えてみてください。

          ... 式(2)

式(2)では掛け算が8回まで減ります。なお、ダミー変数を積極的に使用で紹介したようにxi2をダミー変数にしておけば掛け算の回数をさらに減らせます。

Code 1は式(1)によってコーディングしたものです。Code 2は式(2)によってコーディングしたものです。配列xとyのサイズnは10,000とします。計算時間が非常に短いので、より正確な計算時間を得るためにこの計算は100,000回まわします。

■ ソースコード


  ◆ Code 1   ◆ Code 2
 
      program main
      implicit none
      real*8, parameter :: C1 = -0.1666666666666666d0  ! =1/6
      real*8, parameter :: C2 =  0.8333333333333333d-2 ! =1/120
      real*8, parameter :: C3 = -0.1984126984126984d-3 ! =1/5040
      real*8, parameter :: C4 =  2.7557319223985890d-6 ! =1/362880
      real*8, allocatable :: x(:), y(:)
      real*8 time
      integer*8 time0, time1, dtime
      integer i, j, n, m
c
      n = 10000
      m = 100000

c Initialization
      allocate(x(n), y(n))
      do i=1,n
        x(i) = rand()
      end do

c Start time
      call system_clock(time0)

c Main calculation
      do j=1,m
        do i=1,n
          y(i) = x(i) + C1 * x(i)**3 + C2 * x(i)**5
     &       + C3 * x(i)**7 + C4 * x(i)**9
        end do
      end do

c Finish time
      call system_clock(time1, dtime)

c Output time
      time = 1d0*(time1-time0)/dtime
      write(*,"(a7,f16.7)")"Time = ",time

      deallocate(x, y)
      end program

    
 
      program main
      implicit none
      real*8, parameter :: C1 = -0.1666666666666666d0  ! =1/6
      real*8, parameter :: C2 =  0.8333333333333333d-2 ! =1/120
      real*8, parameter :: C3 = -0.1984126984126984d-3 ! =1/5040
      real*8, parameter :: C4 =  2.7557319223985890d-6 ! =1/362880
      real*8, allocatable :: x(:), y(:)
      real*8 time
      integer*8 time0, time1, dtime
      integer i, j, n, m
c
      n = 10000
      m = 100000

c Initialization
      allocate(x(n), y(n))
      do i=1,n
        x(i) = rand()
      end do

c Start time
      call system_clock(time0)

c Main calculation
      do j=1,m
        do i=1,n
          y(i) = x(i) * (1d0 + x(i)**2 * (C1 + x(i)**2
     &       * (C2 + x(i)**2 * (C3 + C4 * x(i)**2))))
        end do
      end do

c Finish time
      call system_clock(time1, dtime)

c Output time
      time = 1d0*(time1-time0)/dtime
      write(*,"(a7,f16.7)")"Time = ",time

      deallocate(x, y)
      end program

    

■ 計算時間の測定結果

Code 1Code 2の計算時間の測定結果を表1に示します。ここではそれぞれのコードを5回実行して、平均とCode 1Code 2との計算時間の比率も表示します。

表1 計算時間の測定結果(単位: sec)
1回目 2回目 3回目 4回目 5回目 平均 倍率
Code 1 5.97 5.85 5.73 5.73 5.77 5.81 1.57
Code 2 3.63 3.85 3.71 3.65 3.67 3.70 -

■ 考察

Code 1Code 2に比べて掛け算が2回以上多いため、計算時間も1.57倍遅いという結果が得ました。



はじめに

演算数を減らす

メモリジャンプを減らす

高性能のアルゴリズム

その他



5 0 0 3 8 5