LSTMなんか僕だってGPU５枚つかって1週間とかやってたしGoogle辺りは桁が幾つも..

はてな匿名ダイアリー

2023-10-28

■anond:20231028001100

LSTMなんか僕だって GPU５枚つかって1週間とかやってたしGoogle辺りは桁が幾つも違う事やってたよ

BERT出た時Transformerないからね

Permalink | 記事への反応(1) | 00:55

記事への反応 -

anond:20231027231829
この2年てLLMでだいぶ変わったと思うが
- anond:20231027232712
  5年前からやっているがLLMはその当時から巨大だったここ2年で変わったのはTransformerでそういう話を聞いている
  - anond:20231027232957
    そうかもう2023年末か。逆にTransformer無しのLLMなんてあったっけ？LLMの明確な定義もないけどさ。
    - anond:20231027234046
      大規模言語モデルなんてのは全然前からあるよ RNNとかLSTMとかは研究者なら初めの一歩でやってるはず
      - anond:20231028000529
        その時代と比べて大規模だから、BERT以降を"大規模"言語モデルと呼んでるのだと思ったが
        anond:20231028001100
        LSTMなんか僕だってGPU５枚つかって1週間とかやってたしGoogle辺りは桁が幾つも違う事やってたよ BERT出た時Transformerないからね
        anond:20231028005527
        あんたの定義するLLMとは何なんだ？
        anond:20231028104835
        俺に聞かれても知らんけど、BERTが出た時にTransformerなかったのは事実だし、たかがエンジニアの俺がGPU回してたのも事実だし元増田の研究者に聞いてくれと言おうと思ったけど働いてい...

記事への反応（ブックマークコメント）

permalink Twitterでシェア Facebookでシェア

人気エントリ

注目エントリ

ようこそゲストさん