より広い範囲の文脈を見ているというのであれば、単にデータひっぱってく..

はてな匿名ダイアリー

2023-06-24

■anond:20230624173310

より広い範囲の文脈を見ているというのであれば、単にデータひっぱってくればいいだけじゃね？

それがまさしくトランスフォーマー、ってか自己注意機構

再帰型接続みたいな洒落たことするのではなく、過去の任意の地点と現在までに1ステップで接続作れば良いじゃんって発想

ただし文脈で重みは付けましょう、という工夫はする

あと、GPU はいわゆるBLAS 演算(行列の積和演算)のアクセラレータだと思えば良い

Permalink | 記事への反応(0) | 17:49

記事への反応 -

機械学習、アーキ図で部品の必要性わかんないし、GPUのパイプラインもわかんない
機械学習の記事を検索して読んでいるが、色んなアーキテクチャがあるのはわかるが、各部品の必要性がよくわからない。 Transformerあたりから、なんかいきなり構造変わってさっぱり。 ...
- anond:20230624173310
  より広い範囲の文脈を見ているというのであれば、単にデータひっぱってくればいいだけじゃね？それがまさしくトランスフォーマー、ってか自己注意機構再帰型接続みたいな洒落...

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん