CUDA入門 > サンプル入門・初級編 > GPUで計算
このソースは並列処理を行っていません →並列処理に書き換えたソース
これで囲むと、 通常の実行時は、引数として与えられたCUDA関数の呼び出し。 _DEBUGが定義されていると、引数の関数を呼び出し、その戻り値のエラーを検査し、 エラーの場合はエラーメッセージを出力する。
デバイスのメモリ領域を確保します。 devPtr:デバイスメモリのポインタ size:メモリのサイズ
ホストからデバイスにデータをコピーします。 dst:転送先のメモリアドレス src:転送元のメモリアドレス count:コピーするデータのサイズ kind:転送の種類 ▼転送の種類 cudaMemcpyHostToDevice:ホストからデバイスに転送 cudaMemcpyDeviceToHost:デバイスからホストに転送
カーネル関数呼び出しです。 ブロック数、スレッド数の説明は後ほど。