「クロック」を含む日記 RSS

はてなキーワード: クロックとは

2021-02-20

anond:20210220112543

Intelさんが提唱した0.5クロックに敬意を評して

0.5行の修正 費用10兆円規模

2021-01-25

anond:20210125111810

何を対象としたコンパイラかで話が違うんよね

まぁ、そういうの考えないとして

アセンブラ命令は、計算に何を使ったかで消費クロックが違う

その辺の最適化について、最近コンパイラは性能良いぞ

コンパイラがやってくれる分、forのが良い

特にマルチタスクが絡むようなOSを介する場合メーカーの人にアセンブラは書くなって言われる

高級言語コンパイラはその辺の素人が考えるより良く出来てるから差は出ないよ

2021-01-10

コロナで、だめだけど

ガソリンスタンド窓拭き仕事にすればよかった。

アセンブラ知識があって、速度をクロックで読めてC++コードを作りながらDockerKubernetesで並列分散とかもうなんか、覚えることが苦痛に成ってきた。地獄の苦しみ。

2021-01-07

クロックムッシュクロックマダムはあるのに

クロックマドモアゼルがないのは納得行かねえ。

マドモアゼル最高じゃんか。なんで無視されんの。

2021-01-02

会社をくびになったんだ。

仕事を辞める人で、そうでないひと、というのを見たことがない。会社都合でも自己都合でも、結局は同じ。会社不用品といわれた。おんなじことなんdな。

僕を必要としてくれる現場はありますか?

それだけでしかない。i++;もi=i+1;も同じだというのなら、それでもいい。どちらもADDコンパイルするなら、インラインアセンブラでINCを呼び出すだけ。でもわざわざINCを呼べって書いてあるのに

ADDは0.5クロックでINCは1クロックからADDをよんだほうがいいよと、INCをADDに置換するなら、人殺し作品殺しと呼ぶしか無い。

anond:20210102185125

算術演算中にレジスターを使うのか?すごくわかりやすく言うと

加算に3クロックかかる場合、真ん中の1クロックがどうして、レジスターが空いていないんだ?

通常はレジスターからロード算術レジスターへのストアだから、真ん中の1クロックにはレジスター命令が通る

逆にレジスター命令中にどうやったら、レジスターが開くんだ?

2020-12-10

anond:20201210053237

コスパ重視って言ってる通りです。

CPU のコア数やクロックが上がっても、自分用途では出来ることにあまり差はないので。

2020-12-09

Apple M1が高性能な本当の理由解説する

Apple M1の高性能の理由について、ネットはクソみたいな解説記事に溢れている。

技術に明るいはずのはてなーですら某AVライターの間違いだらけの記事に釣られて、300ブクマ超が集まっていて嘆かわしい。

それもこれも後藤センセーがいつまでたっても解説記事を書いてくれないせいではあるが、公開情報が少なすぎるせいでまともなライターほど記事を書けないのも理解できる。

なので素人の俺が解説する。

M1メモリまでSoC化/ワンチップ化したから速い

違います

そもそもM1DRAMSoC化/ワンチップ化していません。M1がやっているのはSiP(System in Package複数チップをワンパッケージに組み込む)であって、eDRAMによるSoCとは全く異なるものです。

SiPSoCJavaJavascriptくらいには違います

SiPだとしてもメモリが近くなるから速い

違います

HBM系のメモリ採用していたらメモリ帯域は大幅に向上しますが、M1は標準DDRメモリをワンパッケージ化しているだけなので、帯域もレイテンシも変わりません。

帯域はM1 MBPとIntel MBP(Ice Lake)でチャネル数同じ、前者はLPDDR4X-4266、後者はLPDDR4X-3733なのでメモリ帯域は14%しか向上していません。また、x86x64新世代のTiger Lake/ReniorはLPDDR4X-4266に対応していますレイテンシM1が96.8ns、Tiger Lakeが98.4nsでほぼ同等です。

Apple M1の実力を最新世代のIntel/AMD CPUと比較。M1が両者を大きく上回る結果ににあるように、SiP化によって消費電力の削減は期待できます

DRAMとの物理距離が縮まって、レイテンシが短くなって速い

違います

SoC-DRAM間がマザーボード上で30cmあったとしても、電気信号の伝送にかかる時間は片道1nsです。仮にSiP化で物理距離が1/100になったとしてもレイテンシ100usが98.02usになるだけで、CPUにとってDRAM絶望的に遠いことに変わりありません。

M1UMA(Unified Memory Architecture)でCPUGPUその他でメモリを共有しているから速い

違います

まず、同一チップ上のCPUGPUが同一のメモリコントローラDRAMを共有するという意味では、Intel2011年Sandy BridgeAMD2011年のLlanoからUMAです。一歩進んだメモリ空間の共有、コヒーレンシの確保という意味でも、AMD2014年Kaveriから対応していて、この点においてM1革新性はありません。

M1CPUGPUメモリコントローラI/Oがワンチップになっているから速い

違います

上記Sandy Bridge、Llanoの世代からかつてのノースブリッジCPUに取り込まれたため、2011年以降のモバイルPC向け”CPU”のほぼ全てにはGPUメモリコントローラが含まれています

かつてのサウスブリッジIntelは今でもワンチップ化こそしていませんが、2013年HaswellからMCMでワンパッケージ内には収められていますAMD2014年のCarrizoからサウスブリッジ機能CPUに取り込まれています

この意味で、x86x64モバイルPC向け”CPU”は、かなり以前からSoCです。

M1はNPUがあるから速い

違います

NPUを活かせるアプリケーション2020年現在では未だ限定的です。もしNPUの有無によってUXが決定的に改善されるなら、NPUありのSnapdargon 8cxを積むSurface Pro Xは同世代Surface Pro 7よりずっと快適でなければなりませんが、そのような事実はありません。

M1が速いのは単にM1CPUGPUが速いからです。

M1CPUコアが採用するArm ISARISCから速い

違います

CISCRISCの論争は20年以上前に終わった話です。その後CISCRISCの美点、RISCCISCの美点を取り入れたので、現代CPUISAがCISCか/RISCかだけで性能が決定されることはありません

歴史的経緯からx86x64デコーダが複雑になりがちなのは事実ですが、5W以下のローパワープロセッサの開発へ向かうIntelにあるように、ISAの差による消費電力増は1020%のレンジで、さらに性能増によって相殺される分、電力効率の差としてはわずかです。

じゃあ結局、なんでM1は速いの?

頑張って最適化してIPC上げたのと、スマホ由来の積極的なDVFS・クロックゲーティング・パワーゲーティングで浮いた消費電力を回しているからです。

気が向いたら書きます

2020-09-23

いまどきXP対応しようとでも思わない限りは、

必要コード

互換性を吸収するXP対応コード 

抜けばXのみ対応となり 数クロック高速化する 可能な限り 薄く小さく作ってある

2020-08-30

じじどもも、化け物クラスが出てきた。ライゼンが、単機なわけがない。ありゃ、仲間の一人っていう設定だ。

かいやつらも未成年に見える外見で、あのざま。マニュアルにない処理ぐらい呼んでくる。

そしてなにより0.0625/8世代の第10世代サンプル

チケットが余りまくってるから

リクエストだしといた。

 すっ

  すっ

   とん

って1クロックで切り替えたいか命令作ってくれ。プログラムで書いたらすごい単純な命令だ。

2020-08-05

わかった。しょうがない。ARMさんは32クロックぐらいでもいいぉ?(更に謙虚な村人)

2020-08-03

メモリー上で直接演算ができる、レジスターを持っているスタックマシンという謎なものもさることながら

どうせSIMDでXMMレジスターが15本もあってHyper Thread対応していることなので

16Bit対応して

すっ

 すっ

  とん

っていう機能も欲しいです。すでにあるそうなので使い方がんばって覚えるけれど ベンチマークがまだ不安定100nanoぐらいなんですが・・・たぶんスタックの切り替え間違えている気が

場合によっては8Mのキャッシュも16このスレイブスレッドごとすべて

すっ

 すっ

  とん

って切り替えてほしいの マスターから見ると16本はスレイブスレッドからマスタースレッドが切り替わるとスレイブ16スレッドも全部切り替わるから

8Mの3次キャッシュも全部切り替えてほしいの1クロック

2020-08-02

20年ぐらいまえから同じ議論をしている気がしますが

もともとは西海岸論文がありまして

しかも今はAVX512ぐらいがありましてASCIIだと64文字ぐらいが1クロック比較演算できる時代になっておりまして

 

512ビットまでは1ワードということになり

 

マルチコアでコア番号がわかってればこんなもんただのヘテロプロセスからしたことはないんだけど

 

内部処理を16Bit化したいんですけど・・・

anond:20200802122707

単精度と倍精度の違いは、単純にはシングルコアデュアルコアクロック数が速くなるわけではないが、計算量は2倍になる。

これに対して、ターボブーストというのはクロック酢の物が上がるので計算速度が上がってる。FLOPSの増加にも色々あるのでFLOPSが増加したからと行ってブーストなのか、コア数を増やしたのかの違いが重要になる

anond:20200802122513

単精度と倍精度は、FLOPS つまり計算量は2倍になりえるが、SIMDみたいなもの時間まりクロック数が倍になるわけではない。

FLOPSと時間まりSecからといって時間が早くなっているとは限らない

から

すっ

 すっ

  とん

エフレームの計算

  2フレーム目の計算

   で とん

なんだけど

ところでインテルさん クロック計算方法について ちょっとききたいことがあるのですが この仕組 マルチコアに使える?

 

すっ

 すっ

  トン

って あのね

2020-08-01

anond:20200801225627

掛け算と足し算を1クロックでやってきたIntelさんには簡単だと思うの。

難しいことはいってない。ただレジスター全部っていうときに、レジスター数増やしたの僕じゃないの。自己責任

16Bit大丈夫。コア当たり・・・

anond:20200801182904

1GHZとして1000*1000*1000/120fpsx3x4x1000

1440x1000=2*1000*1000

500クロックぐらいx3x4コアx4SIMD

2020-07-24

プログラマー

まぁ 4クロックしょうがない。4回掛け算であれば、先行入力もきたいしやすい。実質2クロックには成る 1クロックめが演算終わる頃には4クロック目は どう考えても1次キャッシュにある

あとはストリームでながせばよい。ややRISCではあるが、行列より動画再生支援スロットのほうがわれらがつかう。3x4=12程度のロスはしかたがない。

現実商売で使う動画再生支援を優先してほしい

anond:20200724072339

Intel選手質問:これ1クロック以内にやれっていういみですよね?ブーストみたいな?

 

 ↓

 

勇者ヨシヒコの回答:すっ トン

動画再生支援 すっ トン 1クロック化作戦 予測分岐 といえば 予測分岐なんだけど

 

 あの どこに配線してるの? なんか こう スタックミシン?っていう こう 時間と 空間を 同時に指定しろ ぐらいの騒ぎなんじゃ・・・ロイドーー説明  

 

 あの 博士 スタックしない スタックマシーンは スタックマシーンですか?

 

 CISCSIMD化レジスター対応スタックマシーン

 

 Intel選手 魔王様とヨシヒコ様がたたかっているとはいえ すごいことをいいだしたーーーー

 Intel選手は 大丈夫 さぁ パナソニック選手・・・どうやって対応するか?

 さぁ 

 

 Google先生レジスター対応 スタックマシンもかなりひどいけど

 

 動画再生支援レーン命令対応 スタックマシンもひどい

 

 あのー ちょっとそこ行く 本AKB48 大島優子さん 撮影上仕方ないとはいえ 技術スタッフ なにげに いいよ とかいってるけど これ ひどくね?

 

 

 可変命令レジスター長 スタックマシンとか

 ソフト屋としてはきにならなかったんだけど いまハード?っておもって きに・・・すっ トン↑

2020-07-22

プログラマーにとって ギャルパンティーおくれ っていうていどの望み 

 

Intel動画再生支援のための レーン数を ソフトではなく ハードウェア支援にして 3x4=12こある を実装するために 8Bitマイコンから 16Bitにして、CISCらしく1クロックでお願い XMMとか私分かる程度だから だいじょうーぶ 4倍SIMD 12倍界王拳がつかいたいの 3x4=12ぐらいわかるから だいじょうぶ ぴしっ ぴしっ あーん それSM

 

 

 

小娘 そんなかんたんなことでいいのか?

anond:20200722193509

マニュアル見たらだってここに 2個同時って書いてあるから じゃぁ 2 4 8 16

 

支援機構 1クロック XMM

ログイン ユーザー登録
ようこそ ゲスト さん