Graph Drawing

最近グラフ描画に興味が出てきた。興味が有るといってもDAG限定だけれど。 GraphVizのdotとかdagre.jsとかMSAGLとか色々ソフトはあるんだけれどノードとエッジの数が増えるとレイアウトが完了するまでに非常に時間が掛かる…。並列計算が難しい分野なのだろう…

CUDA SharedMemory

CUDAのSampleにimmaTensorCoreGemmというのがあり、CUDA 10から導入されたWarp Matrix Multiply and Accumulate (WMMA) APIを使ってuint8_tのGEMM演算を行っている。 github.com SharedMemoryのサイズが一定以上なら compute_gemm_imma という kernel を呼び…

CUDA 非同期コピー

developer.nvidia.com CUDA 11.1 からグローバルメモリからシェアードメモリにコピーする際に非同期コピーが使えるようになった。今までのやり方ではレジスタを経由していたようだ。ちょっとDSPのDMA転送っぽいけどglobalからsharedへの一方通行だったり多次…

CUDA

前書き 久々にNVIDIAのCUDAを使う事になったので色々と使い方を調べて知識を更新する事にした。開発者向けの資料は https://docs.nvidia.com/cuda/index.html なおCUDAの初期版がリリースされたのが June 23, 2007; 13 years ago らしい。 NVIDIAのGPUと同じ…

TI C7000 情報

Texas Instruments の C6x シリーズ DSP の後継の C7x について、インターネットで収集した情報を記載する。 C6x シリーズの中でも KeyStone アーキテクチャの C66x コアを載せたDSPの性能は周波数やコア数によって違うけれど、9.6 ~ 179 GFLOPS だそうだ。…

依存性の管理

モジュールの中の要素の調整でファイル更新をすると依存関係の巻き添えが起きて大分待たされる事になって辛い。コンパイラがEntity単位で内容が更新されたかどうかとそれぞれの依存性を把握していれば防げるのだろうか?まぁそんなのは夢物語だからファイル…

BeagleBoard x15

BeagleBoard x15 を購入した。 https://beagleboard.org/getting-started の説明を読んでセットアップ SDカードにイメージを焼き込む まずはSDカードのイメージをダウンロード 現時点の BeagleBoard x15 の最新イメージは、「Debian 9.5 2018-10-07 4GB SD L…

,ai

https://techcrunch.com/2016/08/03/comma-ai-open-sources-the-data-it-used-for-its-first-successful-driverless-trips/ http://robotcar-dataset.robots.ox.ac.uk/datasets/ スピードチャレンジは実践的な課題だなぁ。。。むしろ実戦的というか。

量子化

節約しないと…。 github.com

Darknet

cudnn使うとCPU処理より300倍くらい速い。まぁCPUもGPUも色々なのがあるし、CPU実装が最適化されてないというのはあるけれど。

クロスコンパイル

hackaday.com ラズパイ向けにクロスコンパイルとリモートデバッグ。 www.raspberrypi.org sshfs お手軽。

数学関数

stackoverflow.com 精度良い。実装内容理解してないけど。。。 codingforspeed.com 16回ぐらい掛け算繰り返すと結構精度が良くなる。 stackoverflow.com exp1回だけ使って tanh。

NEON

Raspberry Pi 3 も買ったしNEONプログラミングをちゃんとやるか。。 https://people.xiph.org/~tterribe/daala/neon_tutorial.pdf 古めの情報だけどローレベルな情報が得られるのは有り難い。まぁ自分はasm書きは殆どやらないで来たけれど。 http://hilbert-…

ARM NEON

2015-02-12 の日記と関連 ちょっと興味が出たので再度調査。 http://infocenter.arm.com/help/topic/com.arm.doc.ihi0073a/IHI0073A_arm_neon_intrinsics_ref.pdf https://developer.arm.com/technologies/neon/intrinsics 断片化気にしないでAArch64 NEONだ…

Windows programming

http://stackoverflow.com/a/1956736/4699324 > Custom drawing an Edit control is essentially impossible. うぐむむ。。しょうがない。諦めよう。

1 x 1 convolutionについて

http://iamaaditya.github.io/2016/03/one-by-one-convolution/ 1 x1 convolution って何の意味があるのか分からなかったのでググってみた。

extern template について

http://blog.bitwigglers.org/extern-templates/ が分かりやすかった。

機械学習

機械学習の自習を自宅でやってみる事にする。 CUDAがよく使われてるのでGTX1070と新しい電源ユニットを購入。 そんなに速くないWiMax2+の回線で色々ダウンロードしてインストールしないといけないので時間が掛かる。 TensorFlow Windows上でTensorFlow を動…

GEMM

Deep Learningでは行列積の演算がホットスポットで最適化する対象になる。 https://tkng.org/b/2016/03/06/convolution/ にきっちり纏められていて、 https://petewarden.com/2015/04/20/why-gemm-is-at-the-heart-of-deep-learning/ にもわかりやすい解説が…

ノイズ

同じ問題に遭遇した人がYouTubeに動画を投稿していて、コメント欄で色々情報が収集できた。 https://www.youtube.com/watch?v=Qz5-B0-Tk5Q https://www.youtube.com/watch?v=yzVAK5Llx_M デバイスマネージャーで Intel HD graphicsを無効化して、GeForce GTX…

ノイズ

ノートPCのカーソルキーを押してスクロール表示をさせている時だけ、微妙にノイズが発せられているように聞こえる。まるでHDDにアクセスしているようなカリカリ音に近いけれど、SSDなのでそんなわけもない。 電源オプションを High performance から Power s…

hatena blog に引越し

はてなダイアリーからはてなブログに引越しをする事にした。 古いソフトは高DPI環境向けに調整がされていない事が多くて使いにくいからだ。

VisualStudio で毎回ビルドが行われる問題

ビルドが成功したのにF5で実行するたびに再度ビルドが行われる問題が起きた。 原因は下記のファイルのタイムスタンプが未来になっていたからだった。 C:\Windows\SysWOW64\tzres.dllぐぐると結構色々な人が似たような問題にあたっていたようで、原因も複数あ…

画像圧縮

http://encode.ru/threads/2321-FLIF-Free-Lossless-Image-Format/page4FLIFは展開が遅いらしい、圧縮率は良さそう。

BungBungame

http://pc.watch.impress.co.jp/docs/news/1014364.html このニュースにはとてもびっくりした。。社長の故 徐三泰氏の若いこと。。これからまだまだ活躍出来ただろうに。。 そもそも何で詐欺を働く必要があったんだろう。資金繰りに苦労していたんだろうか。…

MSYS2

MSYS2でMingw-w64を使ってtiny-cnnをビルドしたら色々とトラブルに遭遇した。cmakeでgeneratorを指定していなかった為かlibファイルが見つけられなかった。 pacman -S mingw-w64-x86_64-cmakeこれを入れないと駄目だったらしい。ビルドに成功したけど出来上…

Inno Setup

何故かいつの間にか http://stackoverflow.com/questions/18466156/innosetup-the-driver-or-unc-share-you-selected-does-not-exist-or-is-not-acces この問題に遭遇。コマンドライン引数でDIR指定して解決。。

Radeon RX 480

秋葉原に行ってTSUKUMO本店で2016/06/29 22:00から販売開始のRX480を購入した。値段は税込みで3万2千円弱。何年かしたら2万円くらいに下がってるんだろうか。。 Mini-ITX用のケースだとボードを挿せないので、ケースからマザーボードとかを取り外して使用。…

GPU

「Chainer+CUDA7.5インストール記念 学習速度比較」という記事を読んだ。 http://qiita.com/wakaba130/items/29ad1e72674d93fae3ba#gpu%E5%AE%9F%E8%A1%8CGPU速いなー、GeForce GTX 980 Ti だと一秒間に35000枚近い画像を学習している。そのうち速いGPUだと…

ジョコビッチの生まれ変わる食事: あなたの人生を激変させる14日間プログラム

を読んだ。同じものを大量に摂取しつづけると体が嫌がる。