2024-11-01

新しいAIハードが出てくるのを期待しつつ、ずっとRTX 3090を使っている

AIが盛り上がって数年経つが、個人が買えるような価格帯で、良いAI向けのハードが出てこない。

RTX 3090のVRAM24GBを大事に使っているが、そもそもVRAMに入らないモデルの方が多い。

複数AIを立ち上げるなんてのは、VRAM容量が溢れるので、そもそも動かせない。

動けばNVIDIAの Nsight Systemsなどで遅い所などを探せるが、そこまでいかない。

複数SSD仮想メモリにするというのも、RTX 3090のNVLink BridgeでVRAMだけ拡張するなんてのも世の中に出てこない。


Appleもそろそろ出してくるかと思っていたが、M4普通の順当進化だった。

M2 Ultraはチップtoチップ接続し2.5TB/sを謳ったが、同じチップを繋げたのでいらない機能が倍になっただけだった。

M4 Ultraで、片側のチップGPU or NPU+帯域の広いGDDR or HBMになればいいが、あまり期待が出来ない。

GPU or NPUのコアが増えたとしても、L2/L3キャッシュの容量が少なすぎる、増やしても距離が遠ければ性能も出ないので、

AppleAMDのように3D V-CacheSRAMを積み、Hybrid Bondingで上下の帯域を確保してくれないだろうか


IBMはTelum IIとSpyreを出してきたがエンタープライズ向けなのでパス

Groq社がLLM用LPU、HyperAccel社がLLM用ASICを出して来たが、

Groqは1枚のPCIeカードでは全くメモリ容量が足りず役に立たなそうで、HyperAccelはサーバー前提でこちらも個人から手が出しにくい。

FPGAHBMが載ったPCIeカード個人向けには販売できるような価格でもなければ、そもそも販売すらされない。

ジムケラー率いるTenstorrentも1枚のPCIeだとメモリが足りないし、Ethernetでなんとかやりくりしようとしているが帯域に引っ張られそうに見える。

NextSilicon社がMaverick-2というIntelligent Compute Accelerator (ICA)というのも出してきたが、HPC向けで個人利用からは遠い。


中国も良いのが出てきていない。

Biren、Fuzhou Rockchip、VeriSilicon、Moore Threads、LinJoWing、Loongson、JingJia Micro、Cambricon、Vastai Technologies、Xiangdixian Computing、Enflame Technology、MetaX、Zhaoxin、Lingjiu Microelectronics、

DengLin Technology、Iluvatar CoreX、Innosilicon、Horizon Robotics、Black Sesame Technologies

色々あって追いきれないが、何か飛び出て良いのが出てきたというのは聞かない(日本いるかからもしれないが)

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん