はてなキーワード: SiMDとは
SIMDを前提としているプログラマーにfloatが32Bitとしたばあいに512レジスターは必要ですか?と聞かれると ちょっと回答が難しい。
基本的には個人としてはm128で十分だと思う だがその回答にはm512が必要だと考える人が主張しなければならないが 日本全体を見てもそんなに大勢いるとは思えない 通常はm128で十分
メモリー上で直接演算ができる、レジスターを持っているスタックマシンという謎なものもさることながら
どうせSIMDでXMMレジスターが15本もあってHyper Threadも対応していることなので
すっ
すっ
とん
っていう機能も欲しいです。すでにあるそうなので使い方がんばって覚えるけれど ベンチマークがまだ不安定100nanoぐらいなんですが・・・たぶんスタックの切り替え間違えている気が
場合によっては8Mのキャッシュも16このスレイブスレッドごとすべて
すっ
すっ
とん
って切り替えてほしいの マスターから見ると16本はスレイブスレッドだからマスタースレッドが切り替わるとスレイブ16スレッドも全部切り替わるから
なぜ すっ
すっ
とん
がいるか?
4倍SIMD4倍界王拳 これで16なのである。 そして ついでに4倍 16+2マスター2OSで20こあればたぶんなんとかなるのー
すなおにAVX2を実装したほうがはやいんじゃないか論はあるものの、いらないのSIMDは4倍で大丈夫、4倍界王拳があるから、1次キャッシュで折り返すからオッケー
さすがに鬼畜っていうおもいがあり
とんってずっといってたんだけど
すっ
すっ
とん
でいいかなって
4倍SIMD4倍界王拳x3 というのがあって 動画再生支援のレーン数を万個にして というのがあるので
すっ
すっ
とん
でいいかなって
とんはちょっとな
っていうのがあって
すっ
すっ
とん
でいいかなって
俺たちは扱えないわけではない、扱えるがゆえに面白みがない
その状態では、結局金しかない。が時代が変わった。16コアなんてつかわない。2-3個アプリを立ち上げるのが精一杯。普通に使うとな。
4倍SIMD4倍海王拳 普通はこれで足りる。8コアでいい。そもそも頂点計算そのものが膨大な数。16コア。
しかもGPUとのSyncより早く。まぁ 12コア3x4 4倍SIMDで4ターン。大差はない。価格も効いてくる。束ね方はまぁいい 1コアMaster 4コアSlave x 4倍SIMD これを3個同時 1つのアプリが14コアで2コアOS 頂点計算をしてCUDAで演出