「System in Package」を含む日記 RSS

はてなキーワード: System in Packageとは

2020-12-09

Apple M1が高性能な本当の理由解説する

Apple M1の高性能の理由について、ネットはクソみたいな解説記事に溢れている。

技術に明るいはずのはてなーですら某AVライターの間違いだらけの記事に釣られて、300ブクマ超が集まっていて嘆かわしい。

それもこれも後藤センセーがいつまでたっても解説記事を書いてくれないせいではあるが、公開情報が少なすぎるせいでまともなライターほど記事を書けないのも理解できる。

なので素人の俺が解説する。

M1メモリまでSoC化/ワンチップ化したから速い

違います

そもそもM1DRAMSoC化/ワンチップ化していません。M1がやっているのはSiP(System in Package複数チップをワンパッケージに組み込む)であって、eDRAMによるSoCとは全く異なるものです。

SiPSoCJavaJavascriptくらいには違います

SiPだとしてもメモリが近くなるから速い

違います

HBM系のメモリ採用していたらメモリ帯域は大幅に向上しますが、M1は標準DDRメモリをワンパッケージ化しているだけなので、帯域もレイテンシも変わりません。

帯域はM1 MBPとIntel MBP(Ice Lake)でチャネル数同じ、前者はLPDDR4X-4266、後者はLPDDR4X-3733なのでメモリ帯域は14%しか向上していません。また、x86x64新世代のTiger Lake/ReniorはLPDDR4X-4266に対応していますレイテンシM1が96.8ns、Tiger Lakeが98.4nsでほぼ同等です。

Apple M1の実力を最新世代のIntel/AMD CPUと比較。M1が両者を大きく上回る結果ににあるように、SiP化によって消費電力の削減は期待できます

DRAMとの物理距離が縮まって、レイテンシが短くなって速い

違います

SoC-DRAM間がマザーボード上で30cmあったとしても、電気信号の伝送にかかる時間は片道1nsです。仮にSiP化で物理距離が1/100になったとしてもレイテンシ100usが98.02usになるだけで、CPUにとってDRAM絶望的に遠いことに変わりありません。

M1UMA(Unified Memory Architecture)でCPUGPUその他でメモリを共有しているから速い

違います

まず、同一チップ上のCPUGPUが同一のメモリコントローラDRAMを共有するという意味では、Intel2011年Sandy BridgeAMD2011年のLlanoからUMAです。一歩進んだメモリ空間の共有、コヒーレンシの確保という意味でも、AMD2014年Kaveriから対応していて、この点においてM1革新性はありません。

M1CPUGPUメモリコントローラI/Oがワンチップになっているから速い

違います

上記Sandy Bridge、Llanoの世代からかつてのノースブリッジCPUに取り込まれたため、2011年以降のモバイルPC向け”CPU”のほぼ全てにはGPUメモリコントローラが含まれています

かつてのサウスブリッジIntelは今でもワンチップ化こそしていませんが、2013年HaswellからMCMでワンパッケージ内には収められていますAMD2014年のCarrizoからサウスブリッジ機能CPUに取り込まれています

この意味で、x86x64モバイルPC向け”CPU”は、かなり以前からSoCです。

M1はNPUがあるから速い

違います

NPUを活かせるアプリケーション2020年現在では未だ限定的です。もしNPUの有無によってUXが決定的に改善されるなら、NPUありのSnapdargon 8cxを積むSurface Pro Xは同世代Surface Pro 7よりずっと快適でなければなりませんが、そのような事実はありません。

M1が速いのは単にM1CPUGPUが速いからです。

M1CPUコアが採用するArm ISARISCから速い

違います

CISCRISCの論争は20年以上前に終わった話です。その後CISCRISCの美点、RISCCISCの美点を取り入れたので、現代CPUISAがCISCか/RISCかだけで性能が決定されることはありません

歴史的経緯からx86x64デコーダが複雑になりがちなのは事実ですが、5W以下のローパワープロセッサの開発へ向かうIntelにあるように、ISAの差による消費電力増は1020%のレンジで、さらに性能増によって相殺される分、電力効率の差としてはわずかです。

じゃあ結局、なんでM1は速いの?

頑張って最適化してIPC上げたのと、スマホ由来の積極的なDVFS・クロックゲーティング・パワーゲーティングで浮いた消費電力を回しているからです。

気が向いたら書きます

 
ログイン ユーザー登録
ようこそ ゲスト さん