「haswell」を含む日記 RSS

はてなキーワード: haswellとは

2021-10-18

22nm=ivy bridgeHaswellから、十分現役な気がする

サンディブリッジおじさん、無事死亡。

2020-12-09

Apple M1が高性能な本当の理由解説する

Apple M1の高性能の理由について、ネットはクソみたいな解説記事に溢れている。

技術に明るいはずのはてなーですら某AVライターの間違いだらけの記事に釣られて、300ブクマ超が集まっていて嘆かわしい。

それもこれも後藤センセーがいつまでたっても解説記事を書いてくれないせいではあるが、公開情報が少なすぎるせいでまともなライターほど記事を書けないのも理解できる。

なので素人の俺が解説する。

M1メモリまでSoC化/ワンチップ化したから速い

違います

そもそもM1DRAMSoC化/ワンチップ化していません。M1がやっているのはSiP(System in Package複数チップをワンパッケージに組み込む)であって、eDRAMによるSoCとは全く異なるものです。

SiPSoCJavaJavascriptくらいには違います

SiPだとしてもメモリが近くなるから速い

違います

HBM系のメモリ採用していたらメモリ帯域は大幅に向上しますが、M1は標準DDRメモリをワンパッケージ化しているだけなので、帯域もレイテンシも変わりません。

帯域はM1 MBPとIntel MBP(Ice Lake)でチャネル数同じ、前者はLPDDR4X-4266、後者はLPDDR4X-3733なのでメモリ帯域は14%しか向上していません。また、x86x64新世代のTiger Lake/ReniorはLPDDR4X-4266に対応していますレイテンシM1が96.8ns、Tiger Lakeが98.4nsでほぼ同等です。

Apple M1の実力を最新世代のIntel/AMD CPUと比較。M1が両者を大きく上回る結果ににあるように、SiP化によって消費電力の削減は期待できます

DRAMとの物理距離が縮まって、レイテンシが短くなって速い

違います

SoC-DRAM間がマザーボード上で30cmあったとしても、電気信号の伝送にかかる時間は片道1nsです。仮にSiP化で物理距離が1/100になったとしてもレイテンシ100usが98.02usになるだけで、CPUにとってDRAM絶望的に遠いことに変わりありません。

M1UMA(Unified Memory Architecture)でCPUGPUその他でメモリを共有しているから速い

違います

まず、同一チップ上のCPUGPUが同一のメモリコントローラDRAMを共有するという意味では、Intel2011年Sandy BridgeAMD2011年のLlanoからUMAです。一歩進んだメモリ空間の共有、コヒーレンシの確保という意味でも、AMD2014年Kaveriから対応していて、この点においてM1革新性はありません。

M1CPUGPUメモリコントローラI/Oがワンチップになっているから速い

違います

上記Sandy Bridge、Llanoの世代からかつてのノースブリッジCPUに取り込まれたため、2011年以降のモバイルPC向け”CPU”のほぼ全てにはGPUメモリコントローラが含まれています

かつてのサウスブリッジIntelは今でもワンチップ化こそしていませんが、2013年HaswellからMCMでワンパッケージ内には収められていますAMD2014年のCarrizoからサウスブリッジ機能CPUに取り込まれています

この意味で、x86x64モバイルPC向け”CPU”は、かなり以前からSoCです。

M1はNPUがあるから速い

違います

NPUを活かせるアプリケーション2020年現在では未だ限定的です。もしNPUの有無によってUXが決定的に改善されるなら、NPUありのSnapdargon 8cxを積むSurface Pro Xは同世代Surface Pro 7よりずっと快適でなければなりませんが、そのような事実はありません。

M1が速いのは単にM1CPUGPUが速いからです。

M1CPUコアが採用するArm ISARISCから速い

違います

CISCRISCの論争は20年以上前に終わった話です。その後CISCRISCの美点、RISCCISCの美点を取り入れたので、現代CPUISAがCISCか/RISCかだけで性能が決定されることはありません

歴史的経緯からx86x64デコーダが複雑になりがちなのは事実ですが、5W以下のローパワープロセッサの開発へ向かうIntelにあるように、ISAの差による消費電力増は1020%のレンジで、さらに性能増によって相殺される分、電力効率の差としてはわずかです。

じゃあ結局、なんでM1は速いの?

頑張って最適化してIPC上げたのと、スマホ由来の積極的なDVFS・クロックゲーティング・パワーゲーティングで浮いた消費電力を回しているからです。

気が向いたら書きます

2019-05-21

姪「おじさん、勉強用にパソコンがほしいの」

ぼく「そうかい?ではおにいさんが以前使ってた奴をあげるよ(HaswellCore-i7だし、GTX750Ti積んでるので型落ちだが余裕でサクサク)」

姪「えっと、そうじゃなくて」

ぼく「あ、キーボードマウスは新しいの買ってあげるから大丈夫だよ!」

姪「あのね、そのマックMac book pro)がいいなぁ…」

ぼく「小学生からMac使うと頭がダメになる!(バシーン)」 ※机

姪「(泣)」

 

結局、どうしてもMacがいいというので2010年頃に買ったMac Book Airを渡す事になったけど、絶対満足できないと思う。マイクラだって満足に動かないぜ?

PCは性能だよ。

家族というか、親族や知り合い間でとりあえずPCが欲しくて相談してきてくれたら自分の古いマシンを上げることにしている。)

2016-03-25

無音録画サーバHEVCエンコード機能付き)の構築を調べたメモ

ちょー特殊な人向けの情報だけど、TVを録画して自動エンコード家庭内NASで共有するために調べた。

  • 完全無音の達成

完全無音を達成するには、回転体がなければよい。よって、完全ファンレス化及びSSDを利用する。

そうするために、

必要。ただし、ここで問題となってくるのがHEVCへのエンコード機能HEVC現実時間内に終わらせるには

  • HVENC
  • QSV

必要となる。

NVENCを利用するにはMaxwell 200番台のGPUがほしい。とするとGTX960あたりが必要だが、PSUファンレス化が難しくなる。

一方、HEVCをQSVで利用するにはhaswellもしくはBroadwellcoreシリーズCPU必要になる(Linux対象としているため、intel media server studioサポートされていないCPUは考えない。skylakeは身サポート)。

で、broadwellもしくはhaswellCPUかつACアダプター電源、CPUファンレスマザーボードってあまりない。というか見つからない…

じゃぁ、どうするかってことなんだけどNUCを使う。変態的な方法で。

broadwellNUCに変換アダプターをかまして、PCI-EのPT3を接続する。そうすると録画と変換が可能になり完全ファンレス化を達成できる。

総額を考えると5万くらい?やっぱやめ。

ちなみに自分環境は録画とエンコードを完全に分けて運用している。どうにかして録画とエンコードを同じサーバでやりたいが難しい。

2014-04-13

パソコンダサい人の特徴と、唯一の改善

というネタを考えたけど、面倒くさいのでやめた。

後は頼む。


~~~~~~~~~~~~~~~~~~~~~

(前略)

自作とは、もっと繊細な感覚を持つことです。

例えば一番ベーシックCPUでも、安いとこではセレロン、センプロン、5000円~1万前後ではペンティアムデュアルコアアスロンクアドコア、1万5000円~ではコアi3、コアi5、カヴェリ(A10)、3万円前後ではコアi7、ジーオン多種多様です。上にあげたものは全て演算処理するだけの、ただのCPUです。ですが、それぞれ3DMarkだったり、FFXIVベンチだったり、PCMarkだったりが少しずつ違ってきます

この中から、一番自分に似合うものを探すのが、自作をするということです。決して10スレッドCPUを買うことではないです。(Haswell世代セレロンでも2コア2スレッドなので最低でも2スレッド、あとハイパースレッディングで4スレッドのもある)。

(後略)

2013-12-21

Haswell 4000番台が結構いい感じに仕上がってると思うんだけどどうかな

Core7系そんなに高くないし結構速い

割安なデスクトップ買い増しか

久々にいい部品見つけたか

組み直ししちゃおっかな

とおもってる

 
ログイン ユーザー登録
ようこそ ゲスト さん