「PCIe」を含む日記 RSS

はてなキーワード: PCIeとは

2024-11-20

anond:20241120193146

FenviのWi-Fiモジュールおすすめ

デスクトップPCならこういうPCIeカード

https://www.aliexpress.us/item/1005006727532818.html

Wi-Fiが死んだり不安定になるときは俺の経験上、ほぼすべてRealtek通信チップ積んだ子機側の問題だったから(バッファローとかIODATAとかのUSB子機タイプはだいたいこれ)

intelチップ積んだやつにするとあっさり改善される

Amazonでも似たようなのは買えるけどそんだけ距離ある環境ならアンテナPCIeカード直付けじゃなく独立して置く形のやつのほうがいいし

ヒートシンクついてる立派なヤツのほうがいいだろうからそれだとAmazonはAliExpressの倍の値段する

2024-11-01

新しいAIハードが出てくるのを期待しつつ、ずっとRTX 3090を使っている

AIが盛り上がって数年経つが、個人が買えるような価格帯で、良いAI向けのハードが出てこない。

RTX 3090のVRAM24GBを大事に使っているが、そもそもVRAMに入らないモデルの方が多い。

複数AIを立ち上げるなんてのは、VRAM容量が溢れるので、そもそも動かせない。

動けばNVIDIAの Nsight Systemsなどで遅い所などを探せるが、そこまでいかない。

複数SSD仮想メモリにするというのも、RTX 3090のNVLink BridgeでVRAMだけ拡張するなんてのも世の中に出てこない。


Appleもそろそろ出してくるかと思っていたが、M4普通の順当進化だった。

M2 Ultraはチップtoチップ接続し2.5TB/sを謳ったが、同じチップを繋げたのでいらない機能が倍になっただけだった。

M4 Ultraで、片側のチップGPU or NPU+帯域の広いGDDR or HBMになればいいが、あまり期待が出来ない。

GPU or NPUのコアが増えたとしても、L2/L3キャッシュの容量が少なすぎる、増やしても距離が遠ければ性能も出ないので、

AppleAMDのように3D V-CacheSRAMを積み、Hybrid Bondingで上下の帯域を確保してくれないだろうか


IBMはTelum IIとSpyreを出してきたがエンタープライズ向けなのでパス

Groq社がLLM用LPU、HyperAccel社がLLM用ASICを出して来たが、

Groqは1枚のPCIeカードでは全くメモリ容量が足りず役に立たなそうで、HyperAccelはサーバー前提でこちらも個人から手が出しにくい。

FPGAHBMが載ったPCIeカード個人向けには販売できるような価格でもなければ、そもそも販売すらされない。

ジムケラー率いるTenstorrentも1枚のPCIeだとメモリが足りないし、Ethernetでなんとかやりくりしようとしているが帯域に引っ張られそうに見える。

NextSilicon社がMaverick-2というIntelligent Compute Accelerator (ICA)というのも出してきたが、HPC向けで個人利用からは遠い。


中国も良いのが出てきていない。

Biren、Fuzhou Rockchip、VeriSilicon、Moore Threads、LinJoWing、Loongson、JingJia Micro、Cambricon、Vastai Technologies、Xiangdixian Computing、Enflame Technology、MetaX、Zhaoxin、Lingjiu Microelectronics、

DengLin Technology、Iluvatar CoreX、Innosilicon、Horizon Robotics、Black Sesame Technologies

色々あって追いきれないが、何か飛び出て良いのが出てきたというのは聞かない(日本いるかからもしれないが)

2024-10-30

ラックサーバーTier表

自宅サーバーとして考えたとき

自分が所有しているマシンのみ

Sランク:Proliant DL20 Gen9

AランクPowerEdge R320、PowerEdge R210 II

BランクPowerEdge R430

CランクFUJITSU PRIMERGY TX1320 M2

■Sランク:Proliant DL20 Gen9

小さい、安い、ウェブブラウザからBIOS画面の操作ができる。

PCIE接続RAIDカードがついていない場合オンボードRAIDコントローラー動作し、その場合RedHat系のOSインストールちょっと大変。

最新のOSであるAlmaLinux9、Ubuntu24などもインストールできる。

有名メーカーなのでOS側も大抵対応している。

■AランクPowerEdge R320

安い。

自分が買ったときヤフオクで3000円だった。外付けHDDケース買うより安い。

仮想基盤用のラックサーバーが欲しいとき、4コア8スレッドでは心もとないが、このマシンなら8コア16スレッドできる。

R320に適合する8コア16スレッドCPUは1500円で買えてしまう。

メモリも4000円で64GBとかできちゃう

ウェブブラウザからBIOS画面を操作する機能もあった気がする。(うろ覚え

■AランクPowerEdge R210II

小さい、安い。

Sandy Bridge世代CPUを使うので余り物でよい。

実験台や単一機能用のサーバーとして使うのにちょうどいい。

■BランクPowerEdge R430

自宅サーバーとして使うには厳しい。

体積こそR320と同じだが、CPUを二つ載せられたりちょっと豪華。

でも要らない。値段も高い。

これを買うなら小さいのを二つ買ったほうがいい。

■CランクFUJITSU PRIMERGY TX1320 M2

スリムタイプパソコンのような見た目をしたサーバーマシン

何万円もするライセンス料を払わないとウェブブラウザからBIOS画面を操作する機能を使えない。

OSインストールは頑張る必要が時々ある。Proxmoxはインストールできなかった。

開閉がとても面倒。官公庁が大量に買ってくれるから、といい加減な気持ちで作っているのではないかと疑ってしまう。

グラボを載せられるのが利点。

■番外編

・Jamper EZbook X3 CeleronN3450

サーバーとして使っていたところバッテリーが膨張して変形した。

今は内蔵バッテリーを外して使っているが悪くない。

とても小さく、超低消費電力だ。

HP Prodesk 600 G1

スリムタイプPCなのに3.5インチHDDが2つつけられる。グラボも付けられる。

サーバーOS普通パソコンにはインストール出来て、サーバーマシンにはインストールできないという場面がよくある。

全部RAIDカードのせい。

2024-10-20

ハードエンジニア、選んだの失敗だったか

半導体チップとかを作っているが失敗だった

  1. 国内設計仕事がなくなってきた。東京ならとかの話ではない。アメリカインド中国
  2. 設計ソフトを作っているのが、移民中国人、インド人なので、当然日本語ドキュメントはない。日本市場が小さいのでサポートもあまりない。
  3. 設計ソフトシングルコア性能に制約を受けることが多い。トランジスタ数の増加に追随出来ない。設計データ馬鹿でなくなっていく。設計するためのコンピュータ能力が足りてない
  4. 単位設計ソフトライセンス必要で、そのソフト教育を受けるにもお金がかかる。誰が出すのか。ネットにも使い方の情報はない。
  5. ソフトの使い方を覚えても、どう設計すればいいのかの情報がない。日本語だけでなく、英語でもない。アメリカでも会社に入ってメンターに教えてもらうとか
  6. 先端プロセスが高い。億単位。そのくせ世界中で売れるような仕様なんて、そうそうない。
  7. armのコア、アーキテクチャなど何百ページもあるドキュメント複数あって読むのが大変。エラッタもある。最悪オースティンなどに問い合わせ
  8. 物理限界プロセス、電力、チップサイズシグナインテグリティEMCEMI
  9. FPGAも実際に使えるような大きいものは高すぎる。もちろん趣味個人で買えるようなものはない。(AI向けハードなんて作れやしない、それ以外でも)
  10. 複数FPGA合わせて使うとかになるとハードルがまた上がる
  11. FPGA以外のボードに載っている機能にも引っ張られる
  12. 規格がいつの間にか世界の何処かで立ち上がる(アメリカとか、ヨーロッパとか)
  13. DDRPCIe更新される、セミナー米国だけとか。USB、eUSB、Ether、UCIe、etc。金出さないと規格ドキュメントも見れない。規格あっても守ってなかったり、規格曖昧さがあったりとか
  14. 軍用になると更にわからなくなる。規格や電子戦ってどこから勉強すればいいですか?
  15. 測定機が高い、特殊、使い方覚えるのが大変なのに潰しが効かない、パソコンデータ持って行くの大変で、更に特殊フォーマットで開くのにライセンス料金払ったソフト必要とか
  16. ネットに役に立つ情報はないのに、ニュースコメントばかりは多い(熊本には仕事はないです。不動産は値上がりしたかもしれんが)
  17. コンピュータサイエンスと呼ばれるものソフトエンジニア視点ばかりになる
  18. 機械学習ハードと相性が悪い・・・SRAMサイズメモリ高い、HBM高い
  19. Pythonくらいまで抽象化しないと誰も使わない。というか買ってすぐ稼げるようなパッケージにまでしないと売れない。
  20. C言語だとまだハードに近くで想像ついたが、Pythonになると全然ハードが見えてこない。性能出ないのはキャッシュ共有コアが悪いのか、インターコネクトか、DDRの口か、温度によるクロック低下か

2024-10-13

AI、VRAM容量どうにかする技術出てこない限り、制限かかったままにならない?

Webゲームテクノロジーリブンで、ありもののHWスペックでなんとかするので進んできたけど、AIはそういう感じじゃない。

GPUとは別にVRAMだけのPCIeボード接続して、GPUと帯域稼ぐためのブリッジ接続みたいなの出てこないのだろうか。

2024-09-22

USB、イーサ、PCIe通信速度の上がり方遅いよな

Webくらいだと問題にならんけどもさ

2024-07-19

自作NAS

PCIe4x16 x2以上装備となるとサーバーMBしかなく

安価に作ろうとするとEYPC第一世代あたりになる

仮想サーバ兼務で作ろうとしてる場合問題ないが、ゲームもやろうとすると難しい

AM5かLGA1700なマザーPCIe4x16 x2以上持つことは無理なのでどうすっかな状態

EYPC 4004のPCIeの最大が28レーンじゃなく32以上だったらな・・・

まあ個人で100Gpbsな環境作るとなるとVGA妥協しないと無理だから

Ryzen Threadripperの立ち位置がもうちょっと気軽なWSよりだったら良かったんだがな

素直にSPF28カードで作ったほうがいいか やすいし

2024-04-06

パソコン、これから性能上がるんやろか

もう性能上がらんとか言われつつも上がってきたけど。


CPUは、クロック数は流石に限界っぽい、SRAMプロセス進んでも微細化されなくなった、

SRAM3次元で接合しても3D V-Cacheで性能上がらなかった。


メモリDDR側はレイテンシボトルネック、帯域も足りてない。

CXLで容量は増えそうだけど。


SSDPCIeの帯域増で早くなるけども、PAM4以降どうするのか。

PAM8, PAM16するのだろうけども。

FLASHの速度は変わらず、RAMキャッシュさせるのでなんとか凌いでいるのにRAMも速度上がってない。


冷却方法も新しいのは出てきていない。

コンセント供給能力限界も見えてきた。

2024-04-05

AG03が配信中に音切れしちゃう問題をどうにかこうにか解決たからメ

結論 UEFIPCIEAutoからGen3へ、x16をx8x8にしたら治った

スペック

 B550M Pro4

 Ryzen 5 4500

 Geforce RTX 3060

 AG03

問題

 配信中に高負荷が掛かるとすっごいブツブツなる。問題の切り分けをするとAG03に繋がっている入出力機器から出ているらしい。(ヘッドホンPC直挿しにすると聞こえなくなった)

 マイクからブツブツ鳴り、デスクトップ音声については問題なし。

対処

 電源のプラン変更→効果なし。

 グラボドライバのアプデ→効果なし。

 サンプリングレートの統一効果なし。

 USBの指す場所変える→効果なし。

 UEFIのアプデ→効果なし。

 PCIEをGen3に固定する→効果なし。

 PCIEをx16からx8x8に変更する→効果アリ!

しかしたらグラボの性能悪くなるかもしれないけど、まあ仕方ない。

それにしてもなんでこんな問題が起きてしまってなんでこうすれば治るのかは神のみぞ知る……。

2024-03-21

NVIDIAインテルIBMはどうして差がついてきたのか、あるいは富士通「富岳」CPU民間普及しなかったのは何故か

NVIDIAと、インテルIBMはどうして差がついたのか、疑問に思う。

AIで言えば、IBMのWatsonがずっと先行していた。

AIニューラルネットワーク模倣していると言われ、ニューロモーフィックというチップを、IBMは作り、その後、メンバー移籍してインテルも作った。

現在ニューラルネットワークとは違うものになったが、勝っているのはNVIDIAになっている。


先日、1.58bitのBitNetが話題になったが、LLMではないが昔BinaryConnectで0.68bitまで下げる案を出したのもIBMメンバーだ。

ハッカーニュースでBitNetについてIBMだった人がコメントしている。IBMはそれなりに早かったはずだ。

https://news.ycombinator.com/item?id=39544500


普通GPU会社だと、ゲーム用のGPUボードだけを作っていたと思うが、NVIDIAは色々と手を出している。

データ プロセシング ユニット (DPU)、InfiniBand、NVIDIA MetroXなど、

HPC向けで、インテルAMDIBMの方が得意だろうという分野まで手を出した。

RTX 4090はゲームするにはバカ高いがAI向けには性能不足で、単価が高いAI向けボードを売るという差別化も出来ている。


ファブレス企業から、というだけでは説明不足で、TSMCNVIDIA向けのカスタムプロセスを作らせることが出来ている点が差別化要因の1つだろう。

TSMCから出てくるデザインルールの通りにしか作らないと、どこの会社も似たりよったり性能になってしまう。

物理限界を他社(TSMC)に投げてしまうというのも、経営としては効いているのだろう。

そして物理限界チップサイズを攻める。電力も物理限界を攻める。

日本会社だと、電力のバカ食いで怒られるが、そこも攻めている。


インテルGPUカードに参入したが、AI向けだけに限定した方が良かったのではないだろうか。

DirectX対応既存のゲーミングとの互換性がある。

中国GPUメーカーコケているのに対して、動いているだけでも流石インテルなのだが、競争力のあるGPUとは言えず、参入した意味とは?になってしまっている。


IBMは良くわからない。

量産ではない先端プロセスは持っているし、特殊チップも作れている。

CPUについてはPower関係資産もあり、AI向けもユニークなのが作れているのに、ぱっとしなくなった。

RISC-Vが上手くいくのであれば、OpenPowerも上手くいくと思うのだが、そういう話も聞かない。

そもそも米中関係で、オープンソースCPU/GPUが禁輸されそうな感じもしている。

結局、量子コンピュータについてもまだまだ先になりそうな雰囲気だ。

色々とやっているのに、いまいちブレイクしない。


日本だとすると、富岳のCPUPCIeボードで売りにでも出し手入れば違っていたのだろうか。

2024-03-04

富士通が、京や富岳向けチップPCIe拡張ボード販売していた世界線

日本でもアーキテクトが育成できていたり、AI向けライブラリが作れていたりしたんだろうか

2024-02-29

AIハードウェアアクセラレーター、タイプ異なるボードを挿すってならないのか

GPUは描画に専念でよくて、AI向けチップは別のPCIeボードで挿して、

学習用、推論用とかでもボード分けて、といった構成にならんのだろうか。

2024-02-20

Groqについて

数年前は、TSP(Tensor Streaming Processor)と呼んでいたが、LPU(language processing unit)と名前を変えた?

数年前のチップをそのまま使い続けているかからないが、同じならアーキテクチャは4年前のユーチューブを見るか、アスキーあたりの記事にある。

https://youtu.be/UNG70W8mKbA?si=9VFeopAiPAdn08i_

要は、コインパイラで変換が必要。なので提供されているLLMモデルが限られている。


SRAMを240MB(230MB?)しかない。

PCIeボードが400万くらいらしいが、SRAMの容量が小さすぎて1ボードでは動かない。

DRAMレイテンシSRAMではないので早いのだ、という意見も見られてたが、

1チップSRAM容量が小さすぎるので、チップチップ間、ボードボード間の通信レイテンシは必ずあるはず。

(数ヶ月前から性能上がっているのは、このあたりのチューニングのはず)

DRAMレイテンシというが、これも今どきはレイテンシ気にしないように隠蔽するはず。

チームが小さすぎてハード作れなかった可能性もあるが・・・。DMACでチューニングしているか


ボードにでかいDRAMが載せられるのであれば、そちらの方がボードボード間の通信時間より減るのでは?


グローバルファウンドリ14nmで既に1ボード250Wほど。

GF使ったのは、おそらくAMD設計者が居たからでは。デザインルールどこ破れば性能でるかある程度わかってたとか。1GHzくらいなのは知見なしでやってるとそれくらいで上限くるのはそうだと思う。

チップ世代更新するかはわからないが、兎にも角にも電力下げて、チップ大量に載せて、チップチップ間の通信時間を下げられるか。

2024-01-25

パソコンって、皆期待してるのに進化の速度遅いし、機能や性能のカスタマイズ性もない

AIチップでこれ使えばできることが広がるっていうのも出てこない。

GPUで頑張っているけどVRAMが足りないとか、そういうので制限されている。

CPUじゃなくてもいいが高性能チップを作る人が少ないのか?

PCIeスロットに挿して何か新しい事ができるようなのも出てきてない。

コンピュータサイエンスといっても既存コンピュータの使い方を勉強するから駄目なのか?

2024-01-01

anond:20240101035519

そのマザボなら一般的PCIe M.2を挿せるから空いてるならM.2で良さそうだな

ただPCIeバージョンとレーン数が低い(PCIe2.0のx2レーン)んで、最新のPCIe4.0対応の高いM.2を買ってもフル性能は発揮できん(低い方に性能上限が合わされる)ということだけ注意

普及してる3.0x4くらいの差しても動くはずだが、速度的にはSATAよりはマシという程度かね

anond:20240101032901

SATASerial ATAであってるよ、2.5インチだとクレカみたいなサイズで少し厚いやつだな

M.2 NVMe形式SSD100円ライターみたいに細長いサイズの基盤で早い、接続形式普通PCI Express(PCIe)を使うが、過渡期のやつにはM.2の寸法と端子してるのに内部的にはSATAの回路を使う場合があって、それは遅くなる

ただ端子の形は全然うから

もし現PCスペック表見てPCIeのM.2に対応してて空きスロットがあるならM.2を選んでもいいが

たぶんないだろうから普通に2.5インチSSDを買えばいいよ

2023-12-23

有線LAN有線通信ってなんで進化止まっているん?

1Gbpsから後が全然Wifiの方が10Gbps超えて速くなってきた。

PCIeだとSSDは規格上限迫っている。

DDR5はDDR4から早くなっったっていうけど、アプリベンチマークでは全然効かないし。

2023-12-11

anond:20231211100334

PCIe genなんたら かんたらレーンってそんな遠くまで伸ばせるの?

ライザーケーブル使うだけで性能落ちるって言われてるのに

2023-08-10

あぁ〜特に容量増やす必要ないし速度もいらないのにPCIe Gen4の激速2TB SSD換装したくなる欲が性欲のように定期的に湧き上がってきて仕事にならないよぉ〜

2023-06-09

今のデスクトップパソコン構成時代に合わなくなってきたのでなんとかして欲しい

今のデスクトップパソコンの不満点をあげる。

  1. GPUが3.5スロット専有するので、被って使えなくなるPCIeスロット無駄
  2. M.2をマザーボードにさせるが発熱大きく冷却ファンつけるのを想定すると、マザーボードにさす必要性がない
  3. パソコンケースが大きいわりに中がスカスカ
  4. CPUGPUの帯域がPCIeで足りてない。AIになって更に足りてない。
  5. AIだとVRAMが全然足りない。メモリ仮想化はない。後からVRAM増設も出来ない。

2023-03-13

おすすめPC拡張ハードウェア教えて

だいぶ前に買ったBTOPCを少しずつ部品更新してる自作初心者だけど、このまえマザーを交換したときに前と同じ形でいいやと思ってATXマザーボードにしたんだけど、拡張なんてグラボぐらいしかいかもっとコンパクトボードにすればよかった。

こうなったら何かしら拡張をしてやろうという気持ちなので何かあったら教えてほしい。

スペックは12Gcorei5、メモリ16、グラボ2070SPぐらいだけど足りないなら足りないで考えてみるから、こんなのもあるよくらいでいい。

ポートPCIe?の8とかが何個か開いてるけど、この辺もこの際勉強したいか適当に投げていただいて付けられるかどうか考えます予算も同じ。

今のところの使用用途ブラウジングWordExcelまれちょっとだけ映像編集(雑に字幕つけるぐらい)、ゲーム(重いのはあんまりやらない、最近遊んだので重そうなのは隻狼とか?)程度。

しょーもないのでも何でもいいので、教えて!

2023-02-10

GPUのVRAM24GB以上にならないもの

StableDiffusion系はbf18,fp16,8-bit adamなどで8GB程度でも動くようになったが、追加学習をしようとすると足りない。

日々HuggingFaceに投稿される言語AIや音声、言語画像動画を組み合わせといったのになると、24GBでは足りない。

80GBで足りないのも出てきている。、

GPUは8枚まで並列に出来るので、80GBx8枚=320GBといったのになっている。


個人向けと企業向けで違うだろ、というのはそうだが、

結局チューニングしないとそれほど役に立たず、お高めのパソコンで個々人でチューニング出来るとありがたいのだ。


CXL(Compute Express Link)というメモリ拡張用のバス規格が数年前にでき、製品も出始めている。

今までだとCPUからGPU側のメモリコピーだったのが、アクセラレータから参照も出来るようになるらしいのだが、今の所サーバー向けらしい。


まぁ手段はなんでもいいんだが、VRAMの容量が増えればいい。

PCIeスロットメモリ載ったボードさしたらGPUから拡大して見えるとかでもいい。

2023-01-14

中国、性能高いAIPCIeボード出してくれないか

ゲームしないかGPUボードはいらないのだけど、AIはそろそろ勉強したいのでハードが欲しい。

NVIDIAAIハード高すぎる。

2023-01-13

自作パソコンマザーボードは無くなるのだろうか

性能をあげようとすると、メモリーソケットに付ける、というのがボトルネックになってくる。

Apple M2のように、CPUメモリチップチップ間で接続する、というのが将来の方向性のはずだ。

CPUGPU間のPCIe通信速度が遅いので、GPUとVRAM間で閉じてないと性能が出ない。

となるとCPUGPUチップ間で接続する。


そうなってくるとマザーボードなんていらなくなってこないだろうか。

既に自作PCだとGPU1枚挿すくらいで、拡張性なんてほぼいらないだろう。

ログイン ユーザー登録
ようこそ ゲスト さん