cudaMemcpy2D

ホスト側のメモリとデバイス側のメモリでピッチが異なる場合のコピーに使える。ホスト側のメモリをpinnedにするには、cudaHostRegister っと。。
しかし hemi/array.h は cudaMalloc しか使って無いな。。まぁhemiだけで完結させる場合は良いかもだけど、最初から隠蔽したライブラリを使うのは危ないな。