「アーキテクチャ」を含む日記 RSS

はてなキーワード: アーキテクチャとは

2023-08-24

機械学習、少しアーキテクチャ変わると無駄になるの、改善されないんだろうか

から次へアーキテクチャ出てくるけど、その度に学習し直し。

2023-08-16

諸々遊ぶ用GPUたち個人的まとめ

はじめに

ゲーム用ではなく計算用途(HashCat、SD/NAI、llama.cpp etc…)のまとめ

Linux(もっと言えばArchLinux)で利用する(=できるスキルがある)ことを想定、購入手段は最低限AmazonヤフオクとAliExpressが使えるものとする

増田仕様用途はllama.cppがメインなのでそれにフォーカス

参考資料:llama.cppにおけるVRAM必要量参考(実体験に基づく)

モデル VRAM容量
7B q4_0/q3_K_M 6GB
7B q4_K_M 8GB
7B q4_K_M low-vram 6GB
13B q3_K_S 8GB

P104-100

  • GTX1070相当?
  • VRAM 8GB
  • 持ってる
  • 7B q4_0 25ms/tok

メリット

  • とにかく馬鹿みたいに安い。出来合いのマイニングリグを買ってばらせば1枚当たり3000円とか

デメリット

Arc A380

  • VRAM 6GB
  • 持ってる
  • 7B q4_0 200ms/tok

メリット

  • 無し

デメリット

CMP 30HX

  • GTX1660相当
  • VRAM 6GB
  • 持ってない
  • 7B q4_0 25ms/tok?(同規模のGTX1660の速度から推測)

メリット

  • 割合安い(AliExpressで9.5k円とか)
  • 短い(小さいケースに突っ込める)
  • 比較的低消費電力(とはいえ8pin x 1)

デメリット

CMP 40HX

  • RTX2070相当
  • VRAM 8GB
  • 今度買う
  • 速度は未知数(おそらく7B q4_0で15ms/tok~20ms/tokぐらい?)

メリット

デメリット

2023-08-10

AtCoder水色で業務アルゴリズムカンストするが、水色だけでは業務アルゴリズムは使えない

私は実務では茶色~緑くらいのアルゴリズムしか出てこないと思っている。

とはいえ、水色くらいあれば、そのあたりのアルゴリズム解決可能問題責任を任せられるかというと、チーム開発において実態は違うと思っている。茶色課題解決必要なのは、水色以上のアルゴ力に加え、実務の能力コミュニケーション力、政治力必要だ。

前提として、何でも課題アルゴリズム解決しようとする姿勢正義だとは到底思わない。実際の課題アーキテクチャとして解決すべきものや、ハードウェア性能を見るべきものそもそも課題要件定義レベルで見直すべきもの存在する。

しかし、純粋アルゴリズムでの解決が求められる場合において、水色の実力のみでは、コミュニケーション上の問題課題解決できない。

水色程度だと、茶色程度の自明問題に対して、同僚から筋が悪く性能が劣化するようなアルゴリズム案を提案されても、何故問題かの説明に十分な説明コストを払うことが要求される。

基本的CS習得済みの相手でも、競技経験がない相手だと何故問題か(何故自分提案する内容の方が優れているか)が往々にして理解されないので、このコミュニケーションにはしばしば衝突が起こる。

そういった衝突は、実際のパフォーマンスの計測で押さえつけるものではない。「分からいか客観的比較」したものでなく「自明だが理解されないので、証拠を突きつけて糾弾する」ような形になるためだ。

競技勢は、水色に対して「お世辞でアルゴリズム凄いですよね」と言うことはある。一方で「でも上位ではないんでしょう?」という評価なので、「自分直感とは違うけど、あの人が言ってるんだから正しいのだろう」と思ってくれる可能性が低い。ベテラン戦士であれば自身で一問も問題を解かずして「お前はデータ構造アルゴリズムが分かってない」と非難することすらあるだろう。

そう言う意味で、茶色程度のアルゴリズム責任を持って担当するには、非競技勢にも上位層と思われる程度の称号必要だと思う。最も分かりやす称号は「レッドコーダーである

ただ、資格で黙らせる行為はバッドコミュニケーション典型所業である

上位層でない競プロer茶色程度のアルゴリズム責任を持つためには、まず実務能力コミュニケーション力、政治力を鍛える必要があるだろう。

2023-08-06

プログラミング全然できない

初級者を抜けて中級者になって全然できなくなった

アーキテクチャをこうしたら保守性最悪じゃんとかテストいつからどう書き始めようとかpythonではusecaseパターンどうやるんだろうとか色々考えて手が進まんくなってしまった

下手な初心者より何も書けない

3日間くらい報告が「調べながらアーキテクチャ考えてます」になってそろそろプロダクトオーナーの白い目が痛い

高性能半導体チップ日本設計出来ないのは何が足りてないのか

8bitくらいのCPU書籍もあるし、作れるが、DirectX対応GPUあたりから日本コケ認識だ。

何が足りてなかったのか。

教育か、書籍か、設計ソフトか。


中国スイスインド大学では高性能半導体チップアーキテクチャ講義がある(教授研究者がいる)。

日本コンピューターサイエンスというと、コンピューターアーキテクチャソフト寄りだ。


中国CPUGPUが出てきているが、元インテル、元AMD、元NVIDIAといった略歴で、全く違う土壌から出てきたというものではない。

論文は一部しか説明してないし、各社のプロモーションになっているので、読めばチップ設計出来るようになるわけではない。


どこの企業も出来てないので、転職市場そもそも人がいない。

2023-08-01

anond:20230801101159

まあ開発手法にしてもアーキテクチャーにしても出来ない人間ができるようになるようなもんじゃいからね

上手く使えば複数人複数チームによるオーバーヘッドなくなるので便利だよ

2023-07-31

anond:20230730145051

大多数のITエンジニアがやってる「勉強」って「特定フレームワークAPIを覚える作業」とか「新しいプログラミング言語チュートリアルをなぞる作業」とか「民間資格過去問を覚える作業」とかだし、そんなレベルだったら他の職業の人も十分やっとる

もっと大事なのは抽象化能力論理的思考を鍛えることとか、既存フレームワーク車輪の再発明をしてみるとか、おいそれとは陳腐化しない低レイヤー知識コンピュータアーキテクチャネットワークプロトコルスタックとか線型代数離散数学やらの数学含めた計算機科学知識をつけることとかだと思うんよな

NVIDIAインテルって、チップ性能一番引き出せると思うのに、なんでAIモデル出せないのか

今のAIモデルチップアーキテクチャ無視して作ってそうで、チップアーキテクチャ考慮したら良いのできそうなのに

anond:20230731104947

最近最前線から離れててあんまり追えてないけど、現役のとき2008年くらいか10年くらいの間で、仕事のやり方や設計の考え方が大きく変わったIT技術要素で、いまぱっと思い浮かぶのはこんな感じかな。

分野にもよるし、調査して試作した結果自分業務には採用しなかった技術とかもある。流行ると思って使えるようになったけど流行らなかった技術を入れるとたぶんもっとある。

あと、新機種が出てOSが新しくなったり、ミドルウェアの新バージョン対応テスト手法進化もけっこうカロリー高いけどここには書いてない。

自分フロントエンド専門でReactしかやらない」みたいに分野を絞れば大分減るけど、その技術が何年持つかわからいか普通リスクヘッジのために他の技術も齧らざるを得ないし、バックエンドとかの人と議論するのに結局他分野の知識もそれなりに必要

ソーシャルコーディング(GitHub)

スマホアプリ(iOS, Android)

NoSQL(memcached, Redis, Cassandra)

暗号通貨

クラウドアーキテクチャ、XaaS(AWS, Google Cloud, MicrosoftAzure)

CI/CD(Travis CI, CircleCI, Jenkins)

トランスパイラ(Browserify, webpack, CoffeeScript, TypeScript)

システム(Rust, TypeScript, Haskell)

テスト自動化(xUnitSelenium)

クリーンアーキテクチャ

コンテナDocker

オーケストレーション(Ansible, Kubernetes, Terraform)

機械学習(Python, MATLAB, 線形代数数学知識)

HTML5(WebGL, WebAudio他)

SPA(React, AngularJS, Ember.js, Vue.js)

マイクロサービスアーキテクチャ

3Dゲームエンジン(Unreal Engine無償化、Unity5)の他分野への普及

GraphQL

機械学習ライブラリ(Tensorflow, PyTorch, Chainer)

Jupyter Notebook

NFT

モバイルアプリフレームワーク(React Native, Flutter/Dart)

シングルサインオン

多要素認証生体認証

メタバース

2023-07-26

anond:20230726112135

それ出来るって言わないと思うぞ。

アーキテクチャとかテスト設計重要だと思う。

まあアーキテクチャを考え出すとバックエンドもやることになるけど。

2023-07-23

コードレビューAIできないか

自分自身経験バリバリってわけでもないのに上に立ってくれる人もいなくて、不本意な自走プログラマって感じなんだけど、

正直コードレビューとか設計レビューとかして欲しいと思ってる。

でもさ、最近技術使えばコードレビューAIくらいできるんじゃない?って思うわけ。

変数名の指摘くらいなら十中八九可能でしょ。

テーブル設計アーキテクチャレベルの指摘とかもできるんじゃない?

できないの?

2023-07-12

anond:20230710225641

そこからまた状況が進み、DATファイルへのアクセスが開放されてるので、一部専ブラ特定処置を行うことでまた使えるようになってる。

現段階では、Jane(とそれに賛同した専ブラ開発者たち)が反旗を翻し、新サービスを立ち上げてユーザーもろとも移行させようとしたが、いま一歩及んでないという印象。

なので、Talk への完全移行はなされないのでは?と思われる。

個人的に今回の騒動で一番面白かったのは、一番対応が早かったアーキテクチャMac だったということ。

事実上デファクトスタンダードとなっている専ブラプラグインによる拡張を許容する作りになっていたおかげで、騒動の翌朝にはほぼ今まで通り専ブラが使えるようになってた。

2023-07-04

数千ページあるドキュメント理解する方法が知りたい

例えばArmアーキテクチャとか。

さら実装で使われてないのがあり、なんだ、無いのかよになる。

半導体設計ってやっぱり知らない人多いのか?

  1. ISA定義
  2. アーキテクチャ定義 ドキュメント数千ページある
  3. チップ仕様策定
  4. RTL記述Verilog、SystemVerilog
  5. RTL検証(PSL、SVA、UVM、tcl
  6. 論理合成、タイミング検証tcl
  7. レイアウト
  8. サインオフ検証デザインルールチェック、電源ドロップ

色々省いてこんなのだろうけど、ニュースコメント見てると知られてなさそうな感じがある

2023-06-24

機械学習アーキ図で部品必要性わかんないし、GPUパイプラインもわかんない

機械学習記事検索して読んでいるが、色んなアーキテクチャがあるのはわかるが、各部品の必要性がよくわからない。

Transformerあたりから、なんかいきなり構造変わってさっぱり。

より広い範囲文脈を見ているというのであれば、単にデータひっぱってくればいいだけじゃね?と思ってしまう。


あとGPUで処理するのもよくわからない。

グラフィック処理するためのハードから、頂点シェーダー、ラスタライザーなどは入っていると思うが、AIの時に使っているパイプライン全然わからん

ニューラルネット構造通りにGPU内を組み替えてるのか?

GPU演算器の個数からニューラルネット構成決めりゃ無駄がないように思うが、そういったのを見たことがない。

2023-06-22

IT後進国ニッポンっていうけど、他国は進んでてバグ無いものなん?

米国でも選挙アプリなんて酷かった気がしてるが・・・

米国でもFAXは使われてるし、FAX送ってもそんなす確認してくれなくてある程度溜まったら次の工程行く、みたいな感じでしょ。

ハンコがって言われるが、米国だとレシートチップ何%かとサイン書く

ソーシャルセキュリティー・ナンバー納税について、そんな特段進んでいる気はしないが・・・


システム人間が合わせろっていうけど、簡略化出来て簡単に使える領域システムしかネットに流れてないんじゃないのか?

システム作れる人が法律に凄い詳しいわけでもないし。


海外に良いシステムがあるなら具体例出して欲しい。

もしくは良いシステムアーキテクチャ提案して欲しい。

2023-06-20

AIと今のコンピュータアーキテクチャの相性が悪い気がしてならない

どうもあってるきがしない

2023-05-26

anond:20230526031529

研究ラボで遊ぶ人たちは基本的システムプロダクトの下に膨大なユーザーをぶら下げて、事業を回すための道具だという認識が薄いんですよ。

スキルかいうふわっとした単語JAVAなのかJavaScriptなのかもわからないJavaなんて単語使っちゃうような人にはわからないのかもしれんが。

そもそもスキルってどの分野のどの深度だよって話は20年前でさえそこそこ体系化されてる。

アーキテクチャなのかコーディングなのか電話や電力みたいなファシリティ隣接領域、なんならユーザー向けヘルプデスクだって相応の専門性がある。

コーディングを何年やってもマネージャ経営者にはならないし、なっちゃいけないだろ?

ガチャガチャだ言ってるのはそもそもマッチングする要素を理解できてないか運ゲーから卒業できんのだよ。

anond:20230526031529

偽装派遣多すぎだし、派遣契約なら安すぎだしほんと客先常駐って糞でしかない。額面月40万以下ならやる意味もない。

たまに常駐先にITエンジニアwwwって奴いるけどマジでインフラDBアーキテクチャ言語も知らないくせにググった知識マウント取ってこようとする。あとなぜかアジャイル好き

2023-05-23

apple siliconを皮切りにARM CPUが独占すると思ったけど全然そんなことなかった

高速化電池持ちの良さからapple siliconがx86チップ駆逐すると思ったけど、既存資産を捨てるほど威力はないようで、x86チップはこれから少なくとも10年は使える感じはするねぇ。

armwindowsも開発しているようだけど、スナップドラゴンの性能が低すぎてダメだねぇ。

CPUアーキテクチャの入れ替わりって簡単じゃないんだねぇ。

2023-05-02

AIクイズ番組を作って楽しく学ぶ

何かを学ぶにおいて、クイズ形式楽しい

単に教科書を読むだけより問いかけられたほうが脳が考えようとするし能動的に学習できる。

ならばAIクイズ番組を作ればいいのではないか

プロンプト:「ChatGPTの仕組み」の包括的理解が得られる文章を、クイズ番組の司会風に書いてください。クイズは5問ほど出題してください。それぞれの問題の後に答えと解説を発表してください。

出力:

皆さんこんにちは今日特別クイズ番組にようこそ!私たちあなたに、OpenAIが開発した驚くべき技術、ChatGPTの仕組みについての包括的理解を得るためのクイズを出題します。さあ、問題を出題していきましょう!

問題1: ChatGPTの基本となるAIアーキテクチャは何でしょうか?

答え: GPT-4

解説: ChatGPTは、OpenAIが開発したGPT-4(Generative Pre-trained Transformer 4)というアーキテクチャを基盤としていますGPT-4は、自然言語処理タスクに優れた性能を発揮することで知られています

問題2: GPT-4はどのような学習手法で訓練されていますか?

答え: 事前学習(pre-training)と事後学習fine-tuning

解説: GPT-4は、2段階の学習プロセスで訓練されています最初の段階は事前学習で、大量のテキストデータから言語モデル学習します。次の段階は事後学習で、特定タスクに適した性能を発揮するようにモデルを微調整します。

問題3: ChatGPTが生成するテキスト品質を向上させるために用いられる技術は何でしょうか?

答え: ビームサーチ(Beam Search)

解説: ビームサーチは、生成されるテキスト品質を向上させるために用いられる探索アルゴリズムです。複数候補を同時に生成し、最も尤もらしい文を選択することで、より自然で正確なテキストを生成することが可能になります

問題4: GPT-4が生成するテキストにおいて、長い文章を生成する際に問題となる要因は何でしょうか?

答え: 文脈の長さ(Context Length)

解説: GPT-4は、一度に扱える文脈の長さに制約があります。この制約により、長い文章を生成する際に、以前の文脈が失われることがあり、それが結果として文章一貫性理解度に影響を与えることがあります

問題5: ChatGPTが生成する回答が間違った情報を含む可能性がある理由は何でしょうか?

答え: 学習データに含まれる誤った情報モデルの生成性能の限界

解説: ChatGPTが間違った情報を含む回答を生成する理由は主に2つあります。まず、学習データに含まれる誤った情報が原因となることがあります学習データ不正であると、モデルもそれを学習し、間違った回答を生成することがあります。また、GPT-4は生成モデルであるため、正確な情報学習データに含まれていても、生成時に限界があり、正確性が犠牲になることがあります

以上、5問のクイズでした!皆さんはChatGPTの仕組みについての理解を深めることができましたか?今回のクイズで学んだ知識をぜひ活用して、この驚くべき技術とその可能性についてさらに学んでいってくださいね!それでは、また次回のクイズでお会いしましょう!

包括的理解が得られるかは微妙だが、結構楽しい感じになったように思う。

AI教育にどんどん生かしていくことが待ち望まれる。

ログイン ユーザー登録
ようこそ ゲスト さん