「SiMD」を含む日記 RSS

はてなキーワード: SiMDとは

2024-07-21

テキストエディタってなんやろな?

いやぁ〜、テキストエディタ世界めっちゃディープでんねん!聞いてくださいよ〜。

まず、テキストエディタ心臓部、バッファ管理システムについてや。これ、単なるテキスト保持やないんですわ。例えば、Emacsガベージコレクション機構マーク&スイープ方式採用してて、バッファ内のLispオブジェクト効率的管理してんねん。これがあるから、長時間編集作業でもメモリリークせーへんのや。

次に、レンダリングエンジン。これが曲者でんねん。Unicode標準のUAX #9に準拠した双方向アルゴリズム実装せなアカン。さらに、合字処理のためにOpenTypeのGSUB/GPOSテーブル解析も必要や。Harfbuzzライブラリ使うんやけど、カスタムシェーピングエンジン組み込んで、特殊文字体系にも対応せなアカンのや。

構文解析エンジンも侮れまへんで。LR(1)パーサーじゃ複雑な言語構文に対応でけへんから、GLR(Generalized LR)パーサー実装するんや。これで曖昧文法も扱えるようになるんですわ。Treesitterライブラリ使うと、インクメンタル構文解析ができて、巨大ファイルでもリアルタイムハイライティングできるんや。

差分アルゴリズムも奥が深いんですわ。Myers差分アルゴリズムだけやなくて、Histogram差分アルゴリズム実装せなアカン。大規模リファクタリング差分表示に効くねん。さらに、セマンティック差分アルゴリズムも組み込んで、構造的な変更も検出できるようにするんや。

非同期処理システムめっちゃ重要や。単なるPromiseやasync/awaitやのうて、Reactive Extensionsベースストリーム処理実装するんや。これで、複雑なイベントシーケンスも扱えるようになるんですわ。さらに、アクターモデルベースの並行処理システム組み込んで、マルチコア活用した並列処理も可能にするんや。

最新トレンドめっちゃアツいんですわ。例えば、Language Server Protocolの拡張や。単なる静的解析やのうて、シンボリックAI使うた意味解析まで可能にしてるんや。これで、コード意図理解して、より高度なリファクタリング提案ができるようになるんですわ。

WebAssembly統合進化してるんや。Single Instruction, Multiple Data (SIMD)命令セットサポートで、テキスト処理のパフォーマンスが爆上がりしてんねん。さらに、WebAssembly System Interface (WASI)採用で、ファイルシステムアクセス可能になってるんや。

AI支援機能も侮れまへんで。単なる補完やのうて、プログラム合成(Program Synthesis)技術導入してるんや。部分的仕様から完全なコードを生成できるようになってんねん。さらに、説明生成AI組み込んで、生成されたコードの詳細な解説までしてくれるんですわ。

リアルタイムコラボレーション進化してるんや。Conflict-free Replicated Data Type (CRDT)のカスタム実装で、ネットワーク遅延があっても一貫性保てるようになってんねん。さらに、意図ベースの競合解決アルゴリズム導入して、複雑な編集操作の衝突も自動解決できるようになってるんや。

拡張アーキテクチャもすごいんですわ。WebAssemblyベースプラグインシステム採用して、言語依存せんプラグイン開発可能になってんねん。さらに、サンドボックス化されたランタイム環境提供して、セキュアなプラグイン実行も実現してるんや。

性能評価も厳しくなってるんですわ。起動時間は、コールドスタートだけやのうて、ホットスタートも測定せなアカン。メモリ使用量も、物理メモリだけやなくて、仮想メモリ使用状況も追跡するんや。CPU使用率は、マイクロアーキテクチャレベル最適化まで求められるようになってんねん。レンダリング性能は、GPUアクセラレーション効率評価せなアカンのや。応答性は、入力レイテンシだけやのうて、知覚的な応答性(Perceived Responsiveness)も測定するんですわ。

いや〜、テキストエディタ世界マジでディープすぎて、もう頭おかしなるで〜!こんな感じで、テキストエディタの最深部まで潜ってみましたけど、いかがでしたかテキストエディタ、侮れまへんで〜。ホンマに。

2021-05-24

anond:20210524111726

RISC 64文字以内にiがあるか? FORで64回ループする

CISC 1クロックで64文字比較演算する

これがSIMD

anond:20210524111418

さらにいえば、AVX512なら同じ演算を刷ることで64文字以内にiがあるかわかるから、64文字以内にAIがある可能性が高い

この演算のもの無駄だが64文字を1クロックでI判定ができると言う意味ではSIMDがなにかがわかりやす

2021-05-03

anond:20210503063841

64個までの同時比較ができるSIMDがあるとする

この場合、最大64要素までとして

クイックソートバブルソート比較しろ

この64個までのSIMDがある場合、どの程度の高速化が見込めるが?

SIMDを使わない場合を1としてX倍で答えよ

ただしSIMDとそれ以外の命令セットの切り替えコストは0とする

2021-02-28

anond:20210228003000

あの インテルさんSIMDにすごいよくにた命令があるから ほんのちょっとだけ仕様を変えて0.5クロック

2020-08-27

学校関係者の方へ

しょうしょう本当の話で、SIMDやAVXなどプロセッサー側の進化問題で、

ほんとうにバケツソートのほうが、クイックソートより速いというのは

実業界で起き得ることなので、最も単純に子供用にいうと、こうなる。

2020-08-23

anond:20200823183249

ユウナ世界を救う

そのユウナを救うために グラボがいる。電力がいる。ポジトロンはいわない、小学生のパソにもグラボいるから。 AVXとはいわないAVはな小学生から。でもね、SIMDはいる。コア数もいる。パラレル教えるから。で、グラボ

2020-08-21

6コア12スレッドx4SIMD

忘れちゃいけないSIMDは4つ同時に計算できる技術

x6x2x4=48なんだよ。

2020-08-10

4倍SIMD12倍界王拳!って人のネタではあるんだけど、2次編集権はあるんだけど、

退いてもいいけど、本職で、まじで今目の前のそのソフトを作っているんですが・・・

2020-08-03

IntelCore i5は普及用だからAVX512は必要だろう。普及機向けの実装

対してi7とi3の場合SiMDでよいかわりに、入れてほしいマニア向けの追加実装がある。

SIMDを前提としているプログラマーにfloatが32Bitとしたばあいに512レジスター必要ですか?と聞かれると ちょっと回答が難しい。

基本的には個人としてはm128で十分だと思う だがその回答にはm512が必要だと考える人が主張しなければならないが 日本全体を見てもそんなに大勢いるとは思えない 通常はm128で十分

メモリー上で直接演算ができる、レジスターを持っているスタックマシンという謎なものもさることながら

どうせSIMDでXMMレジスターが15本もあってHyper Thread対応していることなので

16Bit対応して

すっ

 すっ

  とん

っていう機能も欲しいです。すでにあるそうなので使い方がんばって覚えるけれど ベンチマークがまだ不安定100nanoぐらいなんですが・・・たぶんスタックの切り替え間違えている気が

場合によっては8Mのキャッシュも16このスレイブスレッドごとすべて

すっ

 すっ

  とん

って切り替えてほしいの マスターから見ると16本はスレイブスレッドからマスタースレッドが切り替わるとスレイブ16スレッドも全部切り替わるから

8Mの3次キャッシュも全部切り替えてほしいの1クロック

2020-08-02

anond:20200802122513

単精度と倍精度は、FLOPS つまり計算量は2倍になりえるが、SIMDみたいなもの時間まりクロック数が倍になるわけではない。

FLOPSと時間まりSecからといって時間が早くなっているとは限らない

2020-08-01

anond:20200801230903

なぜ すっ

    すっ

     とん

いるか

4倍SIMD4倍界王拳 これで16なのである。 そして ついでに4倍 16+2マスターOSで20こあればたぶんなんとかなるのー

anond:20200801230019

すなおにAVX2を実装したほうがはやいんじゃないか論はあるものの、いらないのSIMDは4倍で大丈夫、4倍界王拳があるから、1次キャッシュで折り返すからオッケー

さすがに鬼畜っていうおもいがあり

とんってずっといってたんだけど

すっ

 すっ

  とん

でいいかなって

4倍SIMD4倍界王拳x3 というのがあって 動画再生支援のレーン数を万個にして というのがあるので

すっ

 すっ

  とん

でいいかなって

 

 とんはちょっと

っていうのがあって

すっ

 すっ

  とん

でいいかなって

ヘテロ と よくある誤解

俺たちは扱えないわけではない、扱えるがゆえに面白みがない

その状態では、結局金しかない。が時代が変わった。16コアなんてつかわない。2-3個アプリを立ち上げるのが精一杯。普通に使うとな。

4倍SIMD4倍海王拳 普通はこれで足りる。8コアでいい。そもそも頂点計算のものが膨大な数。16コア。

しかGPUとのSyncより早く。まぁ 12コア3x4 4倍SIMDで4ターン。大差はない。価格も効いてくる。束ね方はまぁいい 1コアMaster 4コアSlave x 4倍SIMD これを3個同時 1つのアプリが14コアで2コアOS 頂点計算をしてCUDA演出

普通にできる 若い子でも3ヶ月研修期間

anond:20200801182904

1GHZとして1000*1000*1000/120fpsx3x4x1000

1440x1000=2*1000*1000

500クロックぐらいx3x4コアx4SIMD

2020-07-28

100mを10秒とした時に・・・

そもそもMMX世代プログラマーからSIMDなんて、使うだけのレベルなら1週間だし

GPGPUも単純につかうだけなら、そんなに難しいわけもない。

28日間フルブーストみたいなリモートワークだと、1ヶ月で立ち上がりはするが、体がボロボロ

よくわからん

じゃぁなんで3ヶ月もって?体がボロボロってもういった。

2020-07-24

anond:20200724191207

4倍SIMD 12倍界王拳 この拳の熱さをみるがいい スレイブ

16倍SIMD?あるねぇ 32倍界王拳 あるねぇ

冗談からはじまったのがAKBっぽくできている

動画再生支援

万個

レーン追加で

そこからはじまって

3x4=12こある

結構進んだ。

4倍SIMDx12倍界王拳 まぁ 4x12= 

4x12xフュージョン3倍

4x12だからフュージョ3倍(1倍につき 内部で4倍にして 内蔵用だしたよね?NVIDIAさん)

ログイン ユーザー登録
ようこそ ゲスト さん