,ai

https://techcrunch.com/2016/08/03/comma-ai-open-sources-the-data-it-used-for-its-first-successful-driverless-trips/

http://robotcar-dataset.robots.ox.ac.uk/datasets/

 

スピードチャレンジは実践的な課題だなぁ。。。むしろ実戦的というか。

Darknet

cudnn使うとCPU処理より300倍くらい速い。まぁCPUもGPUも色々なのがあるし、CPU実装が最適化されてないというのはあるけれど。

クロスコンパイル

hackaday.com

ラズパイ向けにクロスコンパイルとリモートデバッグ

www.raspberrypi.org

sshfs お手軽。

 

数学関数

stackoverflow.com

精度良い。実装内容理解してないけど。。。

codingforspeed.com

16回ぐらい掛け算繰り返すと結構精度が良くなる。

stackoverflow.com

exp1回だけ使って tanh

NEON

Raspberry Pi 3 も買ったしNEONプログラミングをちゃんとやるか。。

 

https://people.xiph.org/~tterribe/daala/neon_tutorial.pdf

古めの情報だけどローレベルな情報が得られるのは有り難い。まぁ自分はasm書きは殆どやらないで来たけれど。

 

 http://hilbert-space.de/?p=22

https://computer-vision-talks.com/2011-02-08-a-very-fast-bgra-to-grayscale-conversion-on-iphone/

 

 

ARM NEON

2015-02-12 の日記と関連

ちょっと興味が出たので再度調査。

http://infocenter.arm.com/help/topic/com.arm.doc.ihi0073a/IHI0073A_arm_neon_intrinsics_ref.pdf

https://developer.arm.com/technologies/neon/intrinsics

断片化気にしないでAArch64 NEONだけ対象にしたいな。。