ダミー変数を積極的に使用: Sample 2: 球座標から直座標への変換(FORTRAN)

高速化プログラミング   
トップ  >  演算数と高速化  >  ダミー変数を積極的に使用  >  Sample 2: 球座標から直座標への変換(FORTRAN)

ダミー変数を積極的に使用: Sample 2: 球座標から直座標への変換(FORTRAN)

言語の変更:   C版

■ 概要

式(1)は球座標から直座標に変換するための式です。sinやcosなどの関数が多くあり、いかにも重そうな計算です。よく見ると、繰り返しとなる計算があります。それを見つけて計算を少しでも軽くしましょう。

x=r*cos(theta)cos(phi)
y=r*cos(theta)sin(phi)
z=r*sin(theta)           ... 式(1)

下の「回答例」ボタンをクリックすれば、式(2)に回答例が表示されます。興味がある方はクリックする前にぜひ考えてみてください。

          ... 式(2)

Code 1は式(1)によってコーディングしたものです。Code 2は式(2)によってコーディングしたものです。配列xとyのサイズnは10,000とします。計算時間が非常に短いので、より正確な計算時間を得るためにこの計算は1000回まわします。

■ ソースコード


  ◆ Code 1   ◆ Code 2
 
      program main
      implicit none
      real*8, allocatable :: r(:), theta(:), phi(:), x(:), y(:), z(:)
      real*8 time
      integer*8 time0, time1, dtime
      integer i, j, n, m
c
      n = 10000
      m = 1000

c Initialization
      allocate(r(n), theta(n), phi(n), x(n), y(n), z(n))
      do i=1,n
        r(i) = rand()
        theta(i) = rand()
        phi(i) = rand()
      end do

c Start time
      call system_clock(time0)

c Main calculation
      do j=1,m
        do i=1,n
c
          x(i) = r(i) * cos(theta(i)) * cos(phi(i))
          y(i) = r(i) * cos(theta(i)) * sin(phi(i))
          z(i) = r(i) * sin(theta(i))
        end do
      end do

c Finish time
      call system_clock(time1, dtime)

c Output time
      time = 1d0*(time1-time0)/dtime
      write(*,"(a7,f16.7)")"Time = ",time

      deallocate(r, theta, phi, x, y, z)
      end program

    
 
      program main
      implicit none
      real*8, allocatable :: r(:), theta(:), phi(:), x(:), y(:), z(:)
      real*8 time, d
      integer*8 time0, time1, dtime
      integer i, j, n, m
c
      n = 10000
      m = 1000

c Initialization
      allocate(r(n), theta(n), phi(n), x(n), y(n), z(n))
      do i=1,n
        r(i) = rand()
        theta(i) = rand()
        phi(i) = rand()
      end do

c Start time
      call system_clock(time0)

c Main calculation
      do j=1,m
        do i=1,n
          d = r(i) * cos(theta(i))
          x(i) = d * cos(phi(i))
          y(i) = d * sin(phi(i))
          z(i) = r(i) * sin(theta(i))
        end do
      end do

c Finish time
      call system_clock(time1, dtime)

c Output time
      time = 1d0*(time1-time0)/dtime
      write(*,"(a7,f16.7)")"Time = ",time

      deallocate(r, theta, phi, x, y, z)
      end program

    

■ 計算時間の測定結果

Code 1Code 2の計算時間の測定結果を表1に示します。ここではそれぞれのコードを5回実行して、平均とCode 1Code 2との計算時間の比率も表示します。

表1 計算時間の測定結果(単位: sec)
1回目 2回目 3回目 4回目 5回目 平均 倍率
Code 1 2.07 2.06 2.06 2.06 2.06 2.06 1.24
Code 2 1.65 1.67 1.67 1.67 1.67 1.67 -

■ 考察

Code 1Code 2に1.24倍遅いという結果が得ました。



はじめに

演算数を減らす

メモリジャンプを減らす

高性能のアルゴリズム

その他



4 9 4 9 6 1