はてなキーワード: SMPとは
Q.
1つのCPUコアでの逐次処理を高速化することには限界があるため、コア数を増やし並列化させることで性能を向上させる必要がある、という考え方について、市販のサーバコンピュータとスーパーコンピュータで違いはありますか?
A.
この考え方に関して、市販のサーバコンピュータとスーパーコンピュータの間には基本的な違いはありません。両者とも、シングルコアの性能向上に限界がある中で、並列化によって全体的な処理能力を高めるという方向性を共有しています。しかし、その実現方法や規模には大きな違いがあります。 サーバコンピュータとスーパーコンピュータの並列化アプローチの比較 1. 並列化の規模 サーバコンピュータ: 数個から数百個のコアを使用 スーパーコンピュータ: 数万から数百万個のコアを使用 2. 並列化の方法 サーバコンピュータ: 主にSMP(対称型マルチプロセッシング)やNUMA(非一様メモリアクセス)アーキテクチャを採用 比較的少数のプロセッサを密結合 スーパーコンピュータ: 大規模な分散メモリシステムを採用 多数のノードを高速ネットワークで接続 3. 相互接続技術 サーバコンピュータ: 一般的なネットワーク技術(イーサネットなど)を使用 スーパーコンピュータ: 専用の高速相互接続技術(InfiniBand、Tofu Interconnectなど)を使用 4. ソフトウェアとプログラミングモデル サーバコンピュータ: OpenMPやpthreadsなど、比較的シンプルな並列プログラミングモデルを使用 スーパーコンピュータ: MPIなどの複雑な分散メモリプログラミングモデルを使用 ハイブリッド並列化(MPI+OpenMP)などの高度な技術も適用 5. スケーラビリティ サーバコンピュータ: 中規模までの並列化に適しているが、大規模になるとスケーラビリティに課題 スーパーコンピュータ: 極めて大規模な並列化に対応できるよう設計されている 6. 用途 サーバコンピュータ: ウェブサービス、データベース、ビジネスアプリケーションなど、比較的汎用的な用途 スーパーコンピュータ: 気象予報、宇宙物理学シミュレーション、分子動力学計算など、極めて計算負荷の高い科学技術計算
ので、unixbenchの結果を貼っておく。
========================================================================
BYTE UNIX Benchmarks (Version 5.1.3)
System: thinkpad-x260: GNU/Linux
OS: GNU/Linux -- 5.4.0-45-generic -- #49-Ubuntu SMP Wed Aug 26 13:38:52 UTC 2020
Machine: x86_64 (x86_64)
Language: en_US.utf8 (charmap="UTF-8", collate="UTF-8")
CPU 0: Intel(R) Core(TM) i5-6300U CPU @ 2.40GHz (4999.9 bogomips)
Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET, Intel virtualization
CPU 1: Intel(R) Core(TM) i5-6300U CPU @ 2.40GHz (4999.9 bogomips)
Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET, Intel virtualization
CPU 2: Intel(R) Core(TM) i5-6300U CPU @ 2.40GHz (4999.9 bogomips)
Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET, Intel virtualization
CPU 3: Intel(R) Core(TM) i5-6300U CPU @ 2.40GHz (4999.9 bogomips)
Hyper-Threading, x86-64, MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET, Intel virtualization
21:26:57 up 1:01, 2 users, load average: 0.00, 0.00, 0.15; runlevel 2020-09-04
------------------------------------------------------------------------
Benchmark Run: Fri Sep 04 2020 21:26:57 - 21:55:00
4 CPUs in system; running 1 parallel copy of tests
Dhrystone 2 using register variables 38124852.7 lps (10.0 s, 7 samples)
Double-Precision Whetstone 6422.0 MWIPS (9.9 s, 7 samples)
Execl Throughput 4264.8 lps (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks 515046.2 KBps (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks 140474.5 KBps (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks 1617517.8 KBps (30.0 s, 2 samples)
Pipe Throughput 697605.3 lps (10.0 s, 7 samples)
Pipe-based Context Switching 170352.7 lps (10.0 s, 7 samples)
Process Creation 10427.0 lps (30.0 s, 2 samples)
Shell Scripts (1 concurrent) 9734.6 lpm (60.0 s, 2 samples)
Shell Scripts (8 concurrent) 2353.1 lpm (60.0 s, 2 samples)
System Call Overhead 398924.8 lps (10.0 s, 7 samples)
System Benchmarks Index Values BASELINE RESULT INDEX
Dhrystone 2 using register variables 116700.0 38124852.7 3266.9
Double-Precision Whetstone 55.0 6422.0 1167.6
Execl Throughput 43.0 4264.8 991.8
File Copy 1024 bufsize 2000 maxblocks 3960.0 515046.2 1300.6
File Copy 256 bufsize 500 maxblocks 1655.0 140474.5 848.8
File Copy 4096 bufsize 8000 maxblocks 5800.0 1617517.8 2788.8
Pipe Throughput 12440.0 697605.3 560.8
Pipe-based Context Switching 4000.0 170352.7 425.9
Process Creation 126.0 10427.0 827.5
Shell Scripts (1 concurrent) 42.4 9734.6 2295.9
Shell Scripts (8 concurrent) 6.0 2353.1 3921.8
System Call Overhead 15000.0 398924.8 265.9
========
System Benchmarks Index Score 1152.9
------------------------------------------------------------------------
Benchmark Run: Fri Sep 04 2020 21:55:00 - 22:23:04
4 CPUs in system; running 4 parallel copies of tests
Dhrystone 2 using register variables 103355568.3 lps (10.0 s, 7 samples)
Double-Precision Whetstone 22425.8 MWIPS (9.9 s, 7 samples)
Execl Throughput 10514.5 lps (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks 878593.5 KBps (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks 237997.4 KBps (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks 2896282.9 KBps (30.0 s, 2 samples)
Pipe Throughput 1718493.4 lps (10.0 s, 7 samples)
Pipe-based Context Switching 381500.2 lps (10.0 s, 7 samples)
Process Creation 26280.8 lps (30.0 s, 2 samples)
Shell Scripts (1 concurrent) 18979.1 lpm (60.0 s, 2 samples)
Shell Scripts (8 concurrent) 2716.0 lpm (60.1 s, 2 samples)
System Call Overhead 951109.4 lps (10.0 s, 7 samples)
System Benchmarks Index Values BASELINE RESULT INDEX
Dhrystone 2 using register variables 116700.0 103355568.3 8856.5
Double-Precision Whetstone 55.0 22425.8 4077.4
Execl Throughput 43.0 10514.5 2445.2
File Copy 1024 bufsize 2000 maxblocks 3960.0 878593.5 2218.7
File Copy 256 bufsize 500 maxblocks 1655.0 237997.4 1438.1
File Copy 4096 bufsize 8000 maxblocks 5800.0 2896282.9 4993.6
Pipe Throughput 12440.0 1718493.4 1381.4
Pipe-based Context Switching 4000.0 381500.2 953.8
Process Creation 126.0 26280.8 2085.8
Shell Scripts (1 concurrent) 42.4 18979.1 4476.2
Shell Scripts (8 concurrent) 6.0 2716.0 4526.6
System Call Overhead 15000.0 951109.4 634.1
========
鬼饅頭(おにまんじゅう)または芋饅頭(いもまんじゅう)は、薄力粉もしくは上新粉と砂糖を混ぜ合わせた生地に、角切りのさつま芋を
加えて蒸した和菓子。主に愛知県などの東海地方で見られる。略して「鬼まん(おにまん)」とも呼ばれる。
一般的な饅頭や中華まんとは異なり、菓子の中央部に具(餡)がまとまって入りそれを生地が包んだ形ではなく、具であるさつま芋の
角切りが生地に混じっており、表面にもさつま芋の角切りがいくつも見えている。また、一般の饅頭や中華まんよりも生地の粘りが
強く、生地の表面に光沢がある。
名称の由来は諸説あるが、表面にいくつもさつま芋の角切りが見える様子がごつごつして鬼やその金棒を連想させること、戦前は
庶民的な菓子であり、愛知県や岐阜県では、高級店でなく庶民的な和菓子店には必ずといってよいほど鬼饅頭が売られている。
学校・学校教育の現場では給食でデザートとして出されたり、家庭科の調理実習で調製する地域もある。
また、家庭では蒸しパンの素にさつま芋の角切りを混ぜて製する場合もある。
三重県発祥の和菓子店「口福堂」は鬼まんじゅうを全国の店舗で販売しているが、東海地方以外の鬼まんじゅうが一般的でない
https://ja.wikipedia.org/wiki/%E9%AC%BC%E9%A5%85%E9%A0%AD
http://hirakegoma.naganoblog.jp/e1994528.html