2015-03-18から1日間の記事一覧

CUDA Toolkit 7.0

https://developer.nvidia.com/cuda-toolkit 6.5入れたばっかりだけど入れなおしてみるか。。nvccの最適化が良くなったのか最近練習で書いてるプログラムの処理時間が微妙に短くなった。 テンプレート関数を使うと処理時間が遅くなるのは相変わらずだけれど……

CUDA

http://www.nvidia.com/content/GTC-2010/pdfs/2238_GTC2010.pdf Thread-level parallelism (TLP) にばっかり目を向けるんじゃなくてInstruction-level parallelism (ILP)もちゃんと見た方が良いというお話 PTXの確認方法 keep --source-in-ptx -G を付ける…