「dram」を含む日記 RSS

はてなキーワード: dramとは

2024-08-24

機械学習コンピュータサイエンスの顔していながら、全然コンピュータに優しくないよな

画像を離散コサイン変換で、とか、仮想メモリ使いつつもキャッシュヒット率いかに上げるかとか、そういうのから機械学習って遠い。

メモリ局所性なんぞないかキャッシュなんてメモリアクセスレイテンシ隠蔽くらいにしかなってないし、

メモリは帯域はあればあるだけ、容量もあればあるだけ、

Flash AttentionでようやくDRAMへのアクセス減らそうとかあるけど、コンピュータ構成無視

いかに長い文脈認識させられるかになってデータ局所性なんてなくなって、どれだけ複雑な計算データ量を食わせるかになっている。


今までのHPCも同じでコンピュータサイエンスだと言われれば、そうなんだが


GPU使ってながらも、グラフィックスパイプラインみたいなのを、AIレイヤー層ごとに作れているわけでもないし。


2024-07-15

5700x値上がりする前に1台作っとけよ

ssddram付きにしろ

2024-04-14

メモリーってもう劇的に性能上がらんの?

DRAMは、レイテンシはずっと変わらんし、帯域の進化ゆっくり

2024-03-28

パソコン、そろそろ家庭用は性能限界なんか?

DDR4からDDR5で性能上がらん。

128GBで容量は足りることが多くなってきたが、不安定になったり、速度足らん。

VRAMは24GBで足りない。

SSDDRAMキャッシュ体感は上がったけど、やっぱりDRAM側がボトルネック

電源は1200Wでコンセント限界

2024-03-23

anond:20240323111855

温度DRAMの有無で速度がバチクソ変わるし

ボトルネックがなくはないとおもう

2024-02-24

AI向けでコンピュータアーキテクチャは変わるのか?

今までだと命令データキャッシュに乗るのが前提だったが、AIだと、AIモデルGB単位なのでキャッシュそもそも乗らない。

いかキャッシュヒットさせるか、DRAMとのレイテンシ隠蔽するかだったが、キャッシュに乗らないので、メモリ帯域勝負になる。

GPU汎用性があるので使われているが、ゲームだとテクスチャをVRAMに乗せておいて、演算した結果はモニター側へ出力すればよく、

なんだかんだ帯域は足りていたが、AIだとチップチップ間の帯域が足りない。

ニューラルネットワーク接続自体FPGA的に切り替えるのも手だと思うがモデルが大きすぎる。

AI入力も、文書の要約みたいなもので、データの広い範囲で「文脈」を理解しなければならず、広いメモリ空間を参照となる。

メモリ局所性からかけ離れている。

2024-02-20

Groqについて

数年前は、TSP(Tensor Streaming Processor)と呼んでいたが、LPU(language processing unit)と名前を変えた?

数年前のチップをそのまま使い続けているかからないが、同じならアーキテクチャは4年前のユーチューブを見るか、アスキーあたりの記事にある。

https://youtu.be/UNG70W8mKbA?si=9VFeopAiPAdn08i_

要は、コインパイラで変換が必要。なので提供されているLLMモデルが限られている。


SRAMを240MB(230MB?)しかない。

PCIeボードが400万くらいらしいが、SRAMの容量が小さすぎて1ボードでは動かない。

DRAMレイテンシSRAMではないので早いのだ、という意見も見られてたが、

1チップSRAM容量が小さすぎるので、チップチップ間、ボードボード間の通信レイテンシは必ずあるはず。

(数ヶ月前から性能上がっているのは、このあたりのチューニングのはず)

DRAMレイテンシというが、これも今どきはレイテンシ気にしないように隠蔽するはず。

チームが小さすぎてハード作れなかった可能性もあるが・・・。DMACでチューニングしているか


ボードにでかいDRAMが載せられるのであれば、そちらの方がボードボード間の通信時間より減るのでは?


グローバルファウンドリ14nmで既に1ボード250Wほど。

GF使ったのは、おそらくAMD設計者が居たからでは。デザインルールどこ破れば性能でるかある程度わかってたとか。1GHzくらいなのは知見なしでやってるとそれくらいで上限くるのはそうだと思う。

チップ世代更新するかはわからないが、兎にも角にも電力下げて、チップ大量に載せて、チップチップ間の通信時間を下げられるか。

2023-12-27

コンピュータアーキテクチャは今のままなのだろうか

Webを見るには困らんが、何かをしようとすると性能が足りない。

クロック周波数はなんだかんだで上がったが、劇的ではない。

マルチコアソフトがついていっていない。GPUのような構成だと、更に汎用性がない。

SSDは高速になっていくが、DRAMはそのまま。

HBMは極端に高いまま。積層かと言われつつ高いままだし、熱もあってダメそう。

チップサイズは露光限界になって、熱やコンセントからの電力が限界

Appleユニバーサルメモリにしたけど、電力効率は良くても、ピーク性能はいまいちなまま。

CPU-GPU間の帯域は狭いまま。

AI需要は高まっているが、チップ設計情報が少なくてAIに頼れない。

2023-11-21

チップダイ写真から、どこがCPUGPUかは、どうやって調べているのか

Apple M3ダイ写真から、どこがCPUGPU記事が出ていたが、どうやって調べたのか気になっている。


見ていれば、なんとなく繰り返しパターンがあるように見え、それの個数を数えるというのはわかる。

IOパッドの近くにPHYがあるとか、周囲のDRAMの個数などから、なんとなく”ありそう”というのはわかる。


サーマルカメラで撮影しながら、どこが熱源になりそうかブロック個別に動かせば、なんとなくわかるのは想像できる。


だが、これが正解だと自信をもって言えるものなのだろうか。

それとも自分が知らないだけで、ダイリーディングスキルは一般的ものなのだろうか

2023-06-21

anond:20230621145330

ゲームで使うのはキャッシュじゃなくてVRAMでしょ。AIも巨大なパラメータと途中計算結果をVRAMに置く。並列度の高い演算部とVRAM間の帯域が重要なので特殊DRAMが使われる。入力データ転送は微々たるものだしモデルも頻繁に切り替えたりしないから、GPUホスト間の通信帯域はある程度重要だけど、ホスト側のメモリ帯域はどうでも良い。現代の高性能なニューラルネットワークは何チップに分けようが、そのまま回路化するのは無理。基本的演算装置を使い回す。

2023-06-19

[]

マザボCPUソフマップとかでセット売り狙う方が、個別最安値店舗で買うより安い。

NVMe SSDは蝉族でいいからAliExpressかAmazon国内保証が受けられる分、数千円高くてもAmazonの方がベターか。

蝉族とは自作界隈で春頃から注目されてるHIKSEMI Futureとその類似製品郡のこと。中華ブランド自作er向けキワモノ枠ではあるが侮れん。

最新のYMTC製232層3DTLCに、Maxio製MAP1602Aコントローラを積み、DRAMキャッシュレス、と定番Samsung 980 EVO辺りを凌ぐつよつよスペックでありながら、2TBが1万円ちょい、セールなら1万切る、という破格の品。

AliExpressだと今日夕方4時まではFuture 2TBが62.5USDで買える(プロモコードDeals8cとVISA決済割引込み)。たぶん過去最安クラスだけどJPYにして9200円ちょい。円安が憎い。Revolutもクレカチャージ1.7%に両替1%手数料取るようになってドル決済も大してお得じゃなくなったし悲しみ。

これだけ先走って買うとして、今ワタクシが使ってるマザーはH97チップセットから…M.2スロットはあるけどPCIEGen2x2で性能が発揮できないどころじゃない。3x4でも足りないスペックなのに。

はやくGen4x4のマザーに乗り換えて爆速ストレージ体験したいぜ。

2023-06-02

令和05年最新版 日本半導体産業の現状について

台風仕事休みになりそうなので暇つぶしに。

3年くらい前に日本半導体産業の近況をまとめたのですが、ここ数年で政治家先生たちが何かに目覚めたらしく状況が大きく変わりつつあるので各社の状況をアップデート

前回の記事 https://anond.hatelabo.jp/20200813115920

先端ロジック半導体

■ JASM (TSMC日本法人)

熊本工場:28nm, 22nm (工場稼働時) / 16nm, 12nm (将来計画)

日本政府補助金ソニーデンソー出資という離れ業により、業界人が誰も信じていなかったTSMC工場進出が実現した。現在建屋建設が進んでおり、順調にいけば2024年内には量産開始となる。生産が予定されているプロセスはいずれも世界最先端に比べると古いものだが日本では最先端であり、HKMG(ハイケーメタルゲート、トランジスタの性能を上げる技術)やFinFET(フィンフェット、性能の良い3次元トランジスタ)といった技術が新たに導入される。工場生産される半導体の主なクライアント出資者のソニー。衰退の激しい日本の電機業界だが、ソニーはまだ世界と戦う余力を残しており年間半導体購入金額世界10位で日本トップである。ただし、PS3Cell Processor長崎で作っていたように先端プロセッサをここで作れるわけではない。PS5のCPUTSMCの6nmプロセス製造であり、この工場では製造できないのだ。識者の予測ではイメージセンサー向けロジック半導体生産すると想定されている。

■ Rapidus (ラピダス)

千歳工場:2nm

日本政府国策で、IBMから技術を導入し自前で最先端半導体製造を狙う野心的なプロジェクト。量産開始は2027年を予定。

社長を務めるのは御年70歳になる小池氏。

彼は日立トレセンティテクノロジーズ(ルネサス那珂工場前身)→SANDISKWestern Digitalという国内外半導体メーカー渡り歩いた華麗な経歴の持ち主である

以前に社長を務めていたトレセンティテクノロジーズは2000年日立台湾大手ファウンドリUMCとの合弁の半導体製造会社で、世界に先駆け現在の標準となる300mmウェハに対応した先進的な工場であった。ファウンドリ全盛の今から後知恵で見れば、限りなく正解に近い経営戦略先進性を併せ持っていたがビジネスとしては成功しなかった。工場ルネサスに吸収され、小池氏はSANDISKへと移籍することに。そんなわけで今回の国策ファウンドリRapidusの社長就任小池氏の二十数年越しのリベンジマッチでもある。

なお、氏のポエミーなプレゼン業界でも有名。記者会見日本半導体衰退の原因を「驕り」と一刀両断した一枚のパワポ話題さらったが、本人が一番驕っているのではと不安がる声もある。

ルネサスエレクトロニクス

那珂工場:40nm

日立三菱電機NECロジック半導体部門統合した日本代表する半導体メーカー

5万人いた従業員を1/3にする大リストラ、先端プロセス製造から撤退海外メーカーの買収ラッシュを経て復活。そして大躍進。

昨年の売り上げは1兆5千億円を超え、はじめて統合直後の売り上げ(ピークは2011年3月期の1兆1千億)を抜いた。もう1+1+1=1とは言わせない。

旺盛な車載半導体需要にこたえるべく、政府補助金を得てリストラで閉鎖した甲府工場の再稼働を決定。

コロナ禍では働き方が柔軟になり、リモートワークは全国どこでもできるようになった。ルネサスは開発拠点も大リストラで統廃合しており、三菱系の伊丹NEC系の玉川をはじめ全国にあった設計拠点日立系の小平に集約している。地元拠点が閉鎖されて単身赴任をしている人も多かったのだが、最近ではリモートワークを活用して単身赴任先のマンションを引き払った人も出てきている模様。

ユナイテッドセミコンダクタージャパン

三重工場:40nm

増大する車載半導体需要にこたえるべく、デンソー出資してパワー半導体IGBT生産を始めた。筆者はパワー半導体は専門外で、家電芸人が語る家電説明程度にしか話せないため軽く紹介するにとどめたい。

■ タワーパートナーズセミコンダクター

魚津工場:45nm

半導体部門を手放したがっていたPanasonicイスラエル企業Tower Semiconductorと共同で運営していた工場

Panasonic台湾Nuvoton technologyに持ち分株式を売却したため、現在ではイスラエル台湾共同運営という珍しい業態になっている。

さらに、半導体大手IntelTower Semiconductorの買収を進めているため、将来的にはIntel拠点となる可能性があり、日本IntelCPUが作られる世界線もあるかもしれない。

が、本案件は米中対立あおり中国での買収審査が長引いているため、先行きには不透明感が漂う。

メモリ半導体

■ キオクシア

四日市工場 / 北上工場3D NAND 162層

日本代表するメモリ半導体メーカー。前回からの3年で、積層数は96層 → 112層 → 162層と2世代進化した。競合他社は232層品の量産も始めている(キオクシアは開発完了 / 本格量産前)が、最近3D NANDは闇雲に積層数を増やせば低コストで作れるというわけでもない模様。

なお世間では半導体不足のニュースの印象が強く、半導体はもうかっているとの認識があると思うがコロナ禍でのIT投資ブームが終了したメモリ業界リーマンショック以来の大不況である

キオクシアも例外ではなく、最新の4半期決算1000億円単位赤字を計上してしまった。Western Digitalとの統合のうわさがあるが、もちろん筆者は何も知らないし、仮に知っていても絶対にここには書けない。

Micron Memory Japan (旧エルピーダメモリ)

広島工場DRAM 1βnm世代

ルネサスと同じく、NEC日立三菱電機DRAM事業統合で生まれエルピーダメモリ倒産後に米Micronが買収。

前にも書いたが、DRAM業界プロセスサバ読みが横行しており、20nmを切ったあたりから具体的な数字ではなく1X, 1Y, 1Z, 1αときて、ついに1βnm世代の量産にたどり着いた。広島サミットに合わせて、社長来日。岸田総理会談後大々的な設備投資を発表。1γnm世代を目指して日本初の量産用EUV露光装置が導入されることが決まった。

このEUVというのは波長が13.5nmの極超紫外線(Extreme Ultra Violet)を使った露光装置で1台200~300億かかる人類史上最も高価で精密な工作機械でありオランダASML社が独占的に製造している。もっとも、メモリ業界大不況を食らっているのはMicron例外ではなく、岸田総理と華々しく会談している裏で数百人規模のリストラ慣行。こういう外面の良さと裏でやってることのえげつなさの二面性は、いかにも外資だなと思う。

Western Digital

東芝と共同でフラッシュメモリの開発を行っていたSANDISKHDD大手Western Digitalが買収。キオクシアの四日市工場北上工場を共同で運営している。

Western Digitalメモリコントローラーを内製していることで知られSSDの性能の良さに定評があり、スマートフォン向けの売り上げが多いキオクシアとは、同じ工場運営していても得意としている販売先が微妙に異なり、住み分けがなされている。(そのため、2社統合によるシナジー効果が期待されたびたび観測気球的な記事が出回る。)

なお、もともと日系半導体メーカーが大リストラをしていた時の人材の受け皿として中途をたくさん採用していた経緯もあり、人材流動性は高い。在籍時の仕事ぶりがよければ、他社へ転職していった元社員の出戻りも歓迎と聞く。前述のRapidus社長小池氏は、つい先日までここの社長をしていた。余談だが、上記Micron米国本社社長も旧SANDISK創業者Western Digitalによる買収後に引き抜かれている。こういう話を聞くと、いかにも外資だなと思う。

イメージセンサー

ソニーセミコンダクターソリューショングループ

イメージセンサー世界最大のシェアを誇るソニー半導体部門2020年2021年は米中対立あおりを受けて主要顧客Huawei向けの出荷減少に苦しんだが、2022年度は大幅に売り上げを伸ばし、1兆4千億円となった。他の半導体の例にもれずイメージセンサー国際競争過酷であるため、対抗して人員増強を進めている。Panasonicエンジニアを引き抜くために関西設計拠点を開設し、各地の工場拡張も並行して進めている。調子のいい半導体メーカーはどこも人員増強を進めているが、ここ10年ほどは理工系学生半導体業界人気がどん底、かつ人材ニーズも少なかっため、新卒半導体メーカー就職した絶対数が致命的に少なく30~40歳くらいの中堅技術者の確保にどこも苦労している模様。なお、スマートフォン向けカメラの次の飯の種として、車載用途に数年前から注力開始。最近徐々に成果が出始めている。

ファブレス半導体

■ ソシオネクスト

富士通PanasonicLSI設計部門統合してできた日本最大のファブレス半導体メーカー。昨今の半導体ブームの波に乗り、株式上場、売り上げ2000億突破と非常に好調。3年前は1000億程度の売り上げだったので、すさまじい成長であるもっとも、母体となった富士通Panasonicピーク時の半導体売上が1社で5000億近くあったので、少々物足りなさを感じなくもない。復活は道半ばである

メガチップス

ソシオネクスト誕生するまで日本最大のファブレス半導体メーカーだった。もともと任天堂向けの売り上げが大半だったのだが近年は多角化を進めている。昨年の売り上げは約700億とSwitch人気がピークだった時と比べるとやや劣るが営業利益過去最高を記録している。

ザインエレクトロニクス

かつては日本代表するファブレス半導体メーカーと言えばここだった。昨年の売上高は54億と、3年前紹介したときの30億から伸びたものの、ファブレス上位2社からはかなり離されてしまっている。大昔は韓国サムスン電子に自社製品採用されたのがウリで創業者武勇伝にも頻繁に登場していたが、今では売り上げの75%を国内依存しており海外展開の出遅れが否めない。

非先端ロジックマイコンアナログディスクリートなど

東芝

車載用途のパワー半導体需要が伸びており、石川県工場に300mmウェハ対応ライン建設。この記事でよく出てくる300mmウェハとはシリコンの基板の直径であり、大きい方が製造効率が良い。125mm → 150mm → 200mm → 300mmと順調に大型化が進み次は450mm化と思われたが、大きすぎて弊害が大きく、ここ20年間はずっと300mmが最大サイズである

従来はCPUメモリといった分野の製造しか使用されていなかったのだが、ここ5年くらいでパワー半導体にも300mm化の波が押し寄せてきている。

ローム

何かと癖のある京都メーカー車載事業好調で売り上げが順調に伸びている。次世代パワー半導体材料と呼ばれていたSiC日本国内の他のメーカーリード

余談だが、筆者は学生のころSiC実験で扱っていた。単位を落としまくっていた不良学生だったので、教授がワクワクしながら話していたSiCの物性の話はすべて忘れている。今では家電芸人並みのトークしかできないのでSiCについて語ることはご容赦いただきたい。研究から本格量産まで20年超の時間がかかっていることに驚きである。基礎研究の大変さを実感する。

三菱電機

パワー半導体大手半導体に力が入っていないシャープから福山工場敷地を取得し、300mmウェハ対応ラインを構築。SiCライン熊本に作るぞ!パワー半導体には詳しくないからこの辺で勘弁な。

ミライテクノロジー

日本半導体産業が衰退しまくっていたころに、トヨタ危機感を覚えてデンソーとの合弁で設立した車載半導体メーカーコロナ禍中に行われたオンライン学会に知らない会社の人が出てるなと思って調べたらここだった。

■ TI

米系のアナログ半導体世界大手富士通AMD合弁のNOR FlashメーカーSpansionから買収した会津若松工場茨城県美浦工場を持つ。最近日本法人の話をあまり聞かない。

On semiconductor

米系のアナログ半導体大手三洋電機半導体部門を買収したが、旧三洋新潟工場日本政策投資銀行出資ファンドに売却した。現在日本拠点富士通から買収した会津工場富士通半導体事業から手を引き工場を切り売りしたため、会津若松市内には米系大手半導体メーカー工場が立ち並ぶことになった。

Infineon Technologies (インフィニオン)

ドイツ大手電機メーカー、Siemenseが20年ほど前に半導体部門分社化して誕生した。従来欧州半導体メーカー日本での存在感があまりなかったのだが、富士通マイコン半導体部門を米Spansionが買収、そのSpansionを同じく米Cypressが買収、そのCypressをInfineonが買収した結果、日本市場でも存在感を示すようになった。もともとInfineon自体車載半導体に力を入れており、有力自動車メーカーがそろう日本市場に注目しているというのもある。

■ Nuvoton Technology (ヌヴォトン)

台湾半導体メーカー半導体から撤退したがっていたPanasonicからTower Semiconductor共同運営している工場と、マイコン設計部門を買収する。Panasonic時代は、自社家電向けの独自マイコンをメインに作っていたのだが、Nuvotonに買収された後はArmベースの汎用マイコン設計品目が変わった。日本法人は車載モータ制御向けのマイコン開発に特化させていく方針台湾の開発チームとは住み分けを図る模様。富士通ほどではないが、Panasonic半導体部門を切り売りしており、所属していたエンジニアバラバラになってしまった。研究室が一緒でPanasonic半導体部門入社した友人がいたが、彼は今どこに流れ着いているのだろう?

2023-05-16

anond:20230516092041

日本半導体が死んで韓国が伸びてた90年台のDRAMが64Mb品だったからその話をしてるだけじゃないの?誰も今の中国メーカーが安く作る技術で伸びてるなんて言ってないし。増田記事を読めてないだけでは?

https://anond.hatelabo.jp/20230516092336

DRAMは没落したかもしれんが、何もかも没落したわけではない。

半導体の全てを自国で抱えて世界で戦ってる国なんてない

はてブ民よ、元XXの肩書き業界事情を語る専門家に気をつけろ!

現役業界人です。

元日立の技実者が半導体産業没落の理由を語る記事に600ブクマ以上ついてて、大半が好意的な反応(一部懐疑的)なんだけど、この人かなり適当なこと言ってるんで、注意喚起としてここに書いておく。

https://b.hatena.ne.jp/entry/s/president.jp/articles/-/69408

声を大にして言いたいのは、なんでみんな元XXみたいな肩書で、業界事情を話す人を信用できるのかってこと。本当にクリティカル問題事情に通じている人は現役の利害関係者なのでマスコミに漏らせないのってちょっと考えたらわかるよね?(元XX官僚肩書きでウクライナ情勢やコロナ対策を語る胡散臭い人いっぱい思いつくっしょ?)

気になる人は調べてもらえればいいんだけど、この方、純粋技術仕事長岡技科大最後で辞めてから20年間ずっとコンサル的な仕事しかしていないのね。現場最前線から離れて相当な時間がたつわけよ。で、過去実体験を切り売りしながら同じことを知識アップデートもないまま繰り返し話してる感じ。

自分2006年ごろに、講演会でこの人が同志社経営学系の研究員肩書だった時に同じような話を聞いた記憶があって、その時はへーと思ったんだけど、そのときからずっと日本半導体業界が没落した真の理由はこれだ!的な感じのことを発言する場所を変えながら繰り返していてうんざりしている。

知識アップデートがされていない例を挙げると、過剰品質として取り上げられている64Mb DRAMって90年代前半にはすでに開発されていた代物っていえばヤバさが伝わるかな?(2023年現在業界の主力は16Gb)なので、元ゲーム会社社員が初代プレステの開発経験を元に、プレステ5のゲームの開発手法ヤバイ的な話をしているチグハグさなわけよ。

同じメモリの話で公開情報を元に事例を挙げると、3D NANDの話になるが、中国YMTCが業界トップクラスの232層積層品を開発して日米韓大手メーカースペック的には追いついたんだけど、すでに出回っている構造解析レポート(無料で読めるオープンものも多数あり)見る限り非常に高コストで、日本企業よりも高コスト設計をしている中国企業っていう業界からイメージ出来る直感に反したことになってたりするわけで。

日本の電機業界が国際競争力を落とした理由は、過剰品質で値段が高すぎるからだ!とか単純じゃな理由ひとつ説明できる話じゃないんよ。ここ10年くらいで大手電機メーカーがいろんな事業を切り売りしたけど、外資に買収されたある事業が、同じエンジニア、同じ工場、同じ製造フローのまま売り上げを倍増させてる事例はいくらでもあるわけで、それらは単に過剰品質コスト競争力がなかったかダメだったのかと言われると疑問符がつくのね。(具体的な事例は生々しすぎるので流石にここには書けないが。)

長々と書いてしまったけど、1番危惧してるのはビミョーな評論家世間空気が左右されて政治家が変な判断しちゃわないかってことなんよね。アイツら、今でこそ半導体不足のニュースに慌てて、補助金つけまくってるけど10年前には半導体韓国から買えばいいって普通に言ってたのよ。世間空気は変わりやすいんで、こういうふうに問題単純化して騒ぎまくるだけの評論家にはマジうんざりしている。

2023-05-13

anond:20230513121508

大学にも研究管理する力はあんまりない。STAP細胞で死者が出たのは記憶に新しいところ。ねつ造が横行したり掲載料を払うとなんでも掲載する論文誌があったりして難しい。国として特に中国知財戦を戦える組織資金もない。それでもあんまり問題にならないのは、投資家は、米株に投資することができるし、中国企業に投資することもできるので、どこで利益が上がってもあんまり関心がないんだよなぁ。液晶DRAM通信スマホ太陽光発電蓄電池・・・みんなアジア流出した。次はEVがどうなるか。これも中国にもっていかれそう。日本国内は衰退するが、投資家はあまり関心ない。それでもまだAI産業はは日本向きで伸びる余地があるのかも。

2023-04-02

GPUのVRAMに載らないと動かないAIモデルアーキテクチャ的になんとかならないものなんか?

今までのCPUDRAM仮想メモリってのが全然役に立ってないやん。

2023-03-29

AI向けのパソコンって、今の構成じゃないよなぁ

CPUGPUに投げたあと全然遊んでいる。

DRAMもそんな使ってない。

VRAMの容量は小さいとそもそも動かすことすら出来んので大容量欲しい。

CPUクーラー部分含めて空間空いてるから、大きいなクーラー付けられるけど、GPU側は分厚くなって邪魔

マザーボードCPUGPU場所交換したいってなる。

もしくは、マザーボードと水平に、GPUとVRAM積んだライザーカード付けてCPUクーラーみたいなのをGPUに付けたくなる。


2023-01-06

AMD Instinct MI300を個人にも販売してくれたら、色々変わりそうなのにな

個人的にInstinct MI300に注目しているのは、今後のコンピュータ構成はこうなるだろうな、というのを実現していることだ。

Ryzen Threadripperだとコア数が多いものハード的なボトルネックがそこかしこにあるので使いにくいわけだが、

Instinct MI300は良さそうに見える。


現状のPCIeだと帯域が遅く、CPU側のDRAMからGPUのVRAMにコピーするのはそれなりに時間がかかる。

ゲームだと局所性のあるデータを繰り返し使うのでキャッシュで逃れられるし、シーンの切り替えなどでデータ転送するといったことが出来る。

だがAI向けになるとVRAM容量以上(80GBとか)のデータに全てアクセスするので、メモリ転送レイテンシ隠蔽するだけのバッファとしての効果しか意味がなく、メモリ帯域が効いてくる。

Instinct MI300にHBM3が使われていて帯域は広い。レイテンシは大きいと思われるので、そこは気になるが。

2022-11-11

anond:20221111223329

DRAMが遅い理由は読み書き前後に発生する電荷チャージのせいだな(主には)

1T-SRAMの非同期チャージが最速だが特許で守られてる

一応DDR5は小細工があってチャージは多少早くはなった(らしい)がECC標準装備のほうが目玉なのかもしれない

2022-10-08

どうしてGPUのVRAMって後から増設できるようになってないのか

機械学習だとVRAMが足りない。10GBじゃ全然なのだ

なぜGPUのVRAMの容量が必要かというと、溢れた場合CPU側のDRAMWindowsタスクマネージャー上は使えるように数字上は見えるが、

VRAMの容量を超えると途端に性能が出なくなる。CPUGPU100%にはりつき、データの移動だけで処理が進まない。


ほんとどうしてGPUのVRAMは後から拡張できるようになってないのか。

ログイン ユーザー登録
ようこそ ゲスト さん