ダミー変数を積極的に使用: Sample 2: 球座標から直座標への変換(C)

高速化プログラミング   
トップ  >  演算数と高速化  >  ダミー変数を積極的に使用  >  Sample 2: 球座標から直座標への変換(C)

ダミー変数を積極的に使用: Sample 2: 球座標から直座標への変換(C)

言語の変更:   FORTRAN版

■ 概要

式(1)は球座標から直座標に変換するための式です。sinやcosなどの関数が多くあり、いかにも重そうな計算です。よく見ると、繰り返しとなる計算があります。 それを見つけて計算を少しでも軽くしましょう。

x=r*cos(theta)cos(phi)
y=r*cos(theta)sin(phi)
z=r*sin(theta)           ... 式(1)

下の「回答例」ボタンをクリックすれば、式(2)に回答例が表示されます。 興味がある方はクリックする前にぜひ考えてみてください。

          ... 式(2)

Code 1は式(1)によってコーディングしたものです。Code 2は式(2)によってコーディングしたものです。配列xとyのサイズnは10,000とします。計算時間が非常に短いので、より正確な計算時間を得るためにこの計算は1000回まわします。

■ ソースコード


  ◆ Code 1   ◆ Code 2
 
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>
int main()
{
  int i,j;
  int n = 10000, m = 1000;

  // Initialization
  double *r = new double[n];
  double *theta = new double[n];
  double *phi = new double[n];
  double *x = new double[n];
  double *y = new double[n];
  double *z = new double[n];
  for (i=0; i<n; i++) r[i] = rand();
  for (i=0; i<n; i++) theta[i] = rand();
  for (i=0; i<n; i++) phi[i] = rand();

  // Start time
  clock_t time0 = clock();

  // Main calculation
  for (j=0; j<m; j++)
    for (i=0; i<n; i++) {
      //
      x[i] = r[i] * cos(theta[i]) * cos(phi[i]);
      y[i] = r[i] * cos(theta[i]) * sin(phi[i]);
      z[i] = r[i] * sin(theta[i]);
    }

  // Finish time
  clock_t time1 = clock();

  // Output time
  double time = (double)(time1-time0)/CLOCKS_PER_SEC;
  printf("Time = %15.7f sec\n", time);

  delete[] r;
  delete[] theta;
  delete[] phi;
  delete[] x;
  delete[] y;
  delete[] z;
  return 0;
}

    
 
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>
int main()
{
  int i,j;
  int n = 10000, m = 1000;

  // Initialization
  double *r = new double[n];
  double *theta = new double[n];
  double *phi = new double[n];
  double *x = new double[n];
  double *y = new double[n];
  double *z = new double[n];
  for (i=0; i<n; i++) r[i] = rand();
  for (i=0; i<n; i++) theta[i] = rand();
  for (i=0; i<n; i++) phi[i] = rand();

  // Start time
  clock_t time0 = clock();

  // Main calculation
  for (j=0; j<m; j++)
    for (i=0; i<n; i++) {
      double d = r[i] * cos(theta[i]);
      x[i] = d * cos(phi[i]);
      y[i] = d * sin(phi[i]);
      z[i] = r[i] * sin(theta[i]);
    }

  // Finish time
  clock_t time1 = clock();

  // Output time
  double time = (double)(time1-time0)/CLOCKS_PER_SEC;
  printf("Time = %15.7f sec\n", time);

  delete[] r;
  delete[] theta;
  delete[] phi;
  delete[] x;
  delete[] y;
  delete[] z;
  return 0;
}

    

■ 計算時間の測定結果

Code 1Code 2の計算時間の測定結果を表1に示します。ここではそれぞれのコードを5回実行して、平均とCode 1Code 2との計算時間の比率も表示します。

表1 計算時間の測定結果(単位: sec)
1回目 2回目 3回目 4回目 5回目 平均 倍率
Code 1 2.17 2.07 2.06 2.06 2.07 2.09 1.25
Code 2 1.67 1.70 1.68 1.67 1.65 1.67 -

■ 考察

Code 1Code 2に1.25倍遅いという結果が得ました。



はじめに

演算数を減らす

メモリジャンプを減らす

高性能のアルゴリズム

その他



4 8 2 6 0 8