SIMD演算のお話
ARMのNEONは殆ど使った事が無いけれど、色々情報が参照できる。
http://community.arm.com/groups/processors/blog/2010/03/17/coding-for-neon--part-1-load-and-stores
http://community.arm.com/groups/processors/blog/2010/05/10/coding-for-neon--part-2-dealing-with-leftovers
http://community.arm.com/groups/processors/blog/2010/06/28/coding-for-neon--part-3-matrix-multiplication
http://community.arm.com/groups/processors/blog/2010/09/01/coding-for-neon--part-4-shifting-left-and-right
http://community.arm.com/groups/processors/blog/2012/03/13/coding-for-neon--part-5-rearranging-vectors
http://armneon.blogspot.jp/
http://hilbert-space.de/?p=22
http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0801a/CJAJECEI.html
昔はintrinsicsを使ったらコンパイラが出力するコードがいまいちだったらしい。
出来るだけ少ない命令数で目的の処理をこなすのはなんだかパズルみたいだ。。