「SiMD」を含む日記 RSS

はてなキーワード: SiMDとは

2021-05-24

anond:20210524111726

RISC 64文字以内にiがあるか? FORで64回ループする

CISC 1クロックで64文字比較演算する

これがSIMD

anond:20210524111418

さらにいえば、AVX512なら同じ演算を刷ることで64文字以内にiがあるかわかるから、64文字以内にAIがある可能性が高い

この演算のもの無駄だが64文字を1クロックでI判定ができると言う意味ではSIMDがなにかがわかりやす

2021-05-03

anond:20210503063841

64個までの同時比較ができるSIMDがあるとする

この場合、最大64要素までとして

クイックソートバブルソート比較しろ

この64個までのSIMDがある場合、どの程度の高速化が見込めるが?

SIMDを使わない場合を1としてX倍で答えよ

ただしSIMDとそれ以外の命令セットの切り替えコストは0とする

2021-02-28

anond:20210228003000

あの インテルさんSIMDにすごいよくにた命令があるから ほんのちょっとだけ仕様を変えて0.5クロック

2020-08-27

学校関係者の方へ

しょうしょう本当の話で、SIMDやAVXなどプロセッサー側の進化問題で、

ほんとうにバケツソートのほうが、クイックソートより速いというのは

実業界で起き得ることなので、最も単純に子供用にいうと、こうなる。

2020-08-23

anond:20200823183249

ユウナ世界を救う

そのユウナを救うために グラボがいる。電力がいる。ポジトロンはいわない、小学生のパソにもグラボいるから。 AVXとはいわないAVはな小学生から。でもね、SIMDはいる。コア数もいる。パラレル教えるから。で、グラボ

2020-08-21

6コア12スレッドx4SIMD

忘れちゃいけないSIMDは4つ同時に計算できる技術

x6x2x4=48なんだよ。

2020-08-10

4倍SIMD12倍界王拳!って人のネタではあるんだけど、2次編集権はあるんだけど、

退いてもいいけど、本職で、まじで今目の前のそのソフトを作っているんですが・・・

2020-08-03

IntelCore i5は普及用だからAVX512は必要だろう。普及機向けの実装

対してi7とi3の場合SiMDでよいかわりに、入れてほしいマニア向けの追加実装がある。

SIMDを前提としているプログラマーにfloatが32Bitとしたばあいに512レジスター必要ですか?と聞かれると ちょっと回答が難しい。

基本的には個人としてはm128で十分だと思う だがその回答にはm512が必要だと考える人が主張しなければならないが 日本全体を見てもそんなに大勢いるとは思えない 通常はm128で十分

メモリー上で直接演算ができる、レジスターを持っているスタックマシンという謎なものもさることながら

どうせSIMDでXMMレジスターが15本もあってHyper Thread対応していることなので

16Bit対応して

すっ

 すっ

  とん

っていう機能も欲しいです。すでにあるそうなので使い方がんばって覚えるけれど ベンチマークがまだ不安定100nanoぐらいなんですが・・・たぶんスタックの切り替え間違えている気が

場合によっては8Mのキャッシュも16このスレイブスレッドごとすべて

すっ

 すっ

  とん

って切り替えてほしいの マスターから見ると16本はスレイブスレッドからマスタースレッドが切り替わるとスレイブ16スレッドも全部切り替わるから

8Mの3次キャッシュも全部切り替えてほしいの1クロック

2020-08-02

anond:20200802122513

単精度と倍精度は、FLOPS つまり計算量は2倍になりえるが、SIMDみたいなもの時間まりクロック数が倍になるわけではない。

FLOPSと時間まりSecからといって時間が早くなっているとは限らない

2020-08-01

anond:20200801230903

なぜ すっ

    すっ

     とん

いるか

4倍SIMD4倍界王拳 これで16なのである。 そして ついでに4倍 16+2マスターOSで20こあればたぶんなんとかなるのー

anond:20200801230019

すなおにAVX2を実装したほうがはやいんじゃないか論はあるものの、いらないのSIMDは4倍で大丈夫、4倍界王拳があるから、1次キャッシュで折り返すからオッケー

さすがに鬼畜っていうおもいがあり

とんってずっといってたんだけど

すっ

 すっ

  とん

でいいかなって

4倍SIMD4倍界王拳x3 というのがあって 動画再生支援のレーン数を万個にして というのがあるので

すっ

 すっ

  とん

でいいかなって

 

 とんはちょっと

っていうのがあって

すっ

 すっ

  とん

でいいかなって

ヘテロ と よくある誤解

俺たちは扱えないわけではない、扱えるがゆえに面白みがない

その状態では、結局金しかない。が時代が変わった。16コアなんてつかわない。2-3個アプリを立ち上げるのが精一杯。普通に使うとな。

4倍SIMD4倍海王拳 普通はこれで足りる。8コアでいい。そもそも頂点計算のものが膨大な数。16コア。

しかGPUとのSyncより早く。まぁ 12コア3x4 4倍SIMDで4ターン。大差はない。価格も効いてくる。束ね方はまぁいい 1コアMaster 4コアSlave x 4倍SIMD これを3個同時 1つのアプリが14コアで2コアOS 頂点計算をしてCUDA演出

普通にできる 若い子でも3ヶ月研修期間

anond:20200801182904

1GHZとして1000*1000*1000/120fpsx3x4x1000

1440x1000=2*1000*1000

500クロックぐらいx3x4コアx4SIMD

2020-07-28

100mを10秒とした時に・・・

そもそもMMX世代プログラマーからSIMDなんて、使うだけのレベルなら1週間だし

GPGPUも単純につかうだけなら、そんなに難しいわけもない。

28日間フルブーストみたいなリモートワークだと、1ヶ月で立ち上がりはするが、体がボロボロ

よくわからん

じゃぁなんで3ヶ月もって?体がボロボロってもういった。

2020-07-24

anond:20200724191207

4倍SIMD 12倍界王拳 この拳の熱さをみるがいい スレイブ

16倍SIMD?あるねぇ 32倍界王拳 あるねぇ

冗談からはじまったのがAKBっぽくできている

動画再生支援

万個

レーン追加で

そこからはじまって

3x4=12こある

結構進んだ。

4倍SIMDx12倍界王拳 まぁ 4x12= 

4x12xフュージョン3倍

4x12だからフュージョ3倍(1倍につき 内部で4倍にして 内蔵用だしたよね?NVIDIAさん)

ログイン ユーザー登録
ようこそ ゲスト さん