凄い…

今日もcube()以外のところをいじる(面倒な部分は避けたい深層意識が…). で325usec. 既に昨日書いた目標値にせまってるなあ. 文献でもSIMD使ってるので400usec程度が限界かと思っていたが, ちとやみくもに最適化を始めるタイミングが早かったかな. コード整理が大変だ. 明日は用事があるので続きは来週.

確か「とりあえず速度を求めるなら,Pairing関数の計算時間は1msecは切らないとダメだね」,という話を聞いたことがあるので,その1/3ですか!

どのような戦略で実装を行うのだろう.

ソフトウェア実装の場合はCPUやコンパイラアセンブラを意識しないとだめそう.

参照先とは別の話題になるけれど,ハードウェア実装の場合は極限まで配線を減らして,パイプラインやスケジューリングとか?

知ってる単語を並べることしかできないな,こりゃ.