この文にはいくつかの誤解や不正確な記述があります。それらを順に指摘し..

この文にはいくつかの誤解や不正確な記述があります。それらを順に指摘します。

文中で「128Kトークンという巨大な入力コンテキストウィンドウを持っていることになっているが、これは殆ど嘘、ごまかしであり」と述べられていますが、これは事実ではありません。GPT-4の大規模な入力コンテキストは実際に存在し、正確に動作しています。GPT モデルは入力コンテキスト全体を考慮に入れながら応答を生成します。ただし、文脈が長くなりすぎると、特定の部分への依存度が減少し、より一般的な情報に基づく応答が生成されることがあるため、入力全体を「無視」しているように見えることはありますが、これは嘘やごまかしではありません。

2. **「後半が無視される」ことについての誤解**:

文中で「後半については殆ど無視される」と述べていますが、これは完全に正しくはありません。長いテキストを処理する場合、GPTは確かに最初の部分に強く依存する傾向があることがありますが、後半を完全に無視するわけではありません。モデルの動作は、入力されたすべてのトークンを考慮に入れるように設計されていますが、長い文脈の中では情報の重要度が異なる形で処理されることがあります。

3. **「出力を高速化するために適当に回答している」という指摘の誤り**:

GPT-4は、入力の一部だけを読んで適当に回答していると指摘されていますが、これは技術的に誤りです。生成AI モデルは、出力を高速化するために意図的に一部だけを無視するような動作はしません。出力は、全体の文脈を基に応答を生成します。出力の品質や関連性はトークンの数やトレーニングデータによって影響されますが、これは「適当に回答する」とは異なります。

4. **「問題視している人がほとんどいない」という主張**:

この主張も誤解を招く表現です。大規模言語モデルのコンテキスト制限や性能に関する議論は活発に行われており、ユーザーや研究者はその制約を認識し、さまざまな解決策や改善策を模索しています。モデルの制約に飽きたために「誰も使っていない」というのは主観的な意見であり、実際には多くの人々が日々活用しています。

5. **「RAGをがんばる」という表現の曖昧さ**:

RAG（Retrieval-Augmented Generation）は、外部の知識ベースから情報を引き出して生成に役立てる技術ですが、この文脈で「がんばる」と述べるのは具体性に欠けます。実際にどのように取り組むべきかについて、もう少し具体的な説明があると適切です。

全体として、この文はGPT-4の性能や動作に関していくつかの誤解が含まれており、技術的に誤った結論に導いている部分があります。

Permalink | 記事への反応(1) | 11:11

記事への反応 -

LLMをガッツリ使いこなしている人だけが知っていること
GPT-4oの入力コンテキストは殆ど嘘だということ。例えば、DRMをクラックした本とかを読ませて「なんて書いてある？」みたいなことを聞いてみると分かるのだが、後半については殆ど無...
- anond:20240910092816
  この文にはいくつかの誤解や不正確な記述があります。それらを順に指摘します。 1. **GPT-4の入力コンテキストに関する誤解**: 文中で「128Kトークンという巨大な入力コンテキストウィ...
  - anond:20240910111114
    実演どうも
- anond:20240910092816
  うすうすなんか全部読んでなくね？とは感じてた
- anond:20240910092816
  全部読んでないというか、抽象化能力がない。人間がテキストを3000文字読んでも内容を覚えていられるのは、テキストを覚えているわけではなく、テキストから得られる意味を覚えてい...
  - anond:20240910095417
    つーか、人だって本一冊読んで適切にそれを踏まえた回答なんかほぼ無理だろ一部抜粋しただけの共通テストの国語で何点取れるよ
    - anond:20240910121225
      LLM使えない説を唱える奴は国語偏差値高いと思うぞ
  - anond:20240910095417
    人間だって、言われたことに脊髄反射した回答しか返ってこない奴のほうが多い。３手先（自分の回答、相手の反応、それに対する自分の返し）を読んだ回答ができればそこそこ優秀（...
    - anond:20240911064746
      え、その位ある程度想定するのが会話の基本なんじゃないの？相手から何が帰ってくるかも想定しないで、どうやって話しかけられるんだよ
      - anond:20240911064841
        増田の周りにはそこそこ以上に優秀な人しかいないんだろう
        anond:20240911065740
        はえー、どうやってコミュニケーション成立してるんやと思うけど自分が参加したくはないなあ…
        anond:20240911065920
        会話だけで理解しあえてると思ってる方が幻想かもしれない文書に残してすら誤解は生じる
        anond:20240911070501
        理解し合えてるという話はどっからきたの？そんな話は全然してないんだけどなるほど、このレベルで読解できないなら、テキストでも不安だろうねあなたは
        anond:20240911070740
        あなたの世界では理解し合えてないことをコミュニケーションが成立していると言うのか？
        anond:20240911110753
        「どうやってコミュニケーション成立してるんやと思う」どう成立しているのかわからないと言っている成立していると書いてない
        anond:20240911110926
        理解し合えていることはコミュニケーションの前提条件なのだから、どうコミュニケーションが成立しているか問うことは、どう理解し合えているか問うことと同じだよね。
- anond:20240910092816
  結局コレって課金してるヘビーユーザーに対してすら処理できると言ってる容量分の仕事してくれないということなのかな？課金しないフリーライダーなんでそんなもん（あてにならな...
- anond:20240910092816
  マジレスすると入力文に対して誤差の小さい回答をしてるだけだから後半の文章はテキトーになる(重みはそこまで置いてない)。章分けするなりして細かく聞くしかない
- anond:20240910092816
  128Kトークンは128K文字ではないのだからそれはそうやんというのとトークン切りをしていることは既にRedditでは常識で、脱獄にはPoeが良く使われるからPoeを使ったらいいよ。Poeであれば200...
- anond:20240910092816
  Google検索で「あなたの検索ワードの結果は約50000件あります！」 20ページめ位でもう終わりですって言ってくるくせに
- anond:20240910092816
  計算リソースを削減したいOpenAIの努力の結晶というところかプログラムの生成とかでも中略多用してくるし、色々面倒やね有料版はそのへん緩和してほしいなぁ
- anond:20240910092816
  そら安直に128000単語読ませても全部覚えてる訳ないそういうケースならチャプターごとに再帰的に要約させると良いとopenai公式のプロンプトエンジニアリングガイドに書いてあるよ https:...
- anond:20240910092816
  使いこなせてないっすね
- anond:20240910092816
  最近できるの事の輪郭が見えてきてすこし飽きてきた
- anond:20240910092816
  巨大なテーブル読み込ませて最後に三行だけ重要データを入れてたらきちんとそれに反応したただし洞察としてカスだったつまりそういうの含めクオリティがカスなので皆使わなくな...
- anond:20240910092816
  これ、生成AIの中身を理解していない人がこういうことをよく言う 128kトークン入れて後半が無視されるのはアテンションが前半の方で固定化されてしまってるからそもそも128kトークン...
  - anond:20240910112020
    読み込める量は無限じゃないんですか？ https://gigazine.net/news/20240415-google-llm-infini-attention/
  - anond:20240910112020
    文字列逆順にしてぶち込んだらどうなんのこれトークナイザ? を通した後でさ
- anond:20240910092816
  これ実際そうで大量のコンテキストを入力すると後半のことは結構無視される。他のLLMもそう。人間も大量に何か言われたら最初のことしか覚えてないのに似てる。コンテキストウイン...
- anond:20240910092816
  これ実際そうで大量のコンテキストを入力すると後半のことは結構無視される。他のLLMもそう。人間も大量に何か言われたら最初のことしか覚えてないのに似てる。コンテキストウイン...
- anond:20240910092816
  以前より長文理解ではChatGPTが明確に弱いって言われてるし、GPT-4oでも改善されていないことを知っている。特に後半部分でかなりの部分を理解していない。長文を処理する用途では個人...
- anond:20240910092816
  先進国→すぐれたソフトウェアを作り出す永遠の縄文時代日本→先進国様が開発してくださったソフトウェアを使いこなしてドヤる
  - anond:20240910123538
    これは下請け根性が抜けないブルーカラー層の僻みですわ
- anond:20240910092816
  人間と一緒だね、手抜きなんて
- anond:20240910092816
  前提となるデータを多めに読み込ませるようなケースだと、途中から前提を無視するよね。前提情報は細かいとこまで指示するような使い方を私はしてるので、4oの方が4よりも精度下が...
- anond:20240910092816
  GPT-builder の knowledge-dataとして参照させてください。全体を一括処理するような場合を除けば 10万token あったとしても問題ないはず。API で公式サービスに対抗するのは大変なのでゴニョゴ...
- anond:20240910092816
  まぁガッツリ使ったわけじゃないけどさー GPT-4oやらClaude3やらでプログラムコード書いてもらうのやってみたらさー、あいつらFORTAN77で書けつーてるのに、どうみてもFORTRAN95かそれより新...
- anond:20240910092816
  現状、文章生成AIのいいところは圧倒的に文字を書くのが速いってところだけだな。プロンプトに書かれてる文章の理解能力はあがってるけど、回答のバリエーションはなかなか増えな...
- anond:20240910092816
  人間も必要になったら目次を目安にパラパラめくって読むだろ最初のほうに目次があるのはバカでもわかるからな
- anond:20240910092816
  ワイも同じことされたら前書きだけ読んで適当に答えるやで…😟
- anond:20240910092816
  AIのことは全くわからないんだけど、AIに元増田みたいな文章を出力させることは可能なの？
- anond:20240910092816
  主が曖昧な書き方をしているせいで、リプが混乱している。ほとんどの反応はWebバージョンのChatGPT-4oとGPT-4oの最大トークン数の違いさえ理解していないと思われる。Webバージョンの話な...
  - anond:20240910180344
    なにいってんだこいつ
    - anond:20240910180843
      ほんとだよなww　Webなんか使ってる低レベルユーザーが増田にいるわけがない
    - anond:20240910180843
      現状では詳しそうに見せかけたサイトでさえ、きちんとChatGPTとGPTの書き分けが出来ているところは少ないので初学者が勘違いしてしまうのも無理はないと思う。正確に記せば、Web版のCha...
- anond:20240910092816
  今のところ、LLMは自分の得意分野をやってもらうためのツールではなく、自分が知らない分野を完璧には理解してないかもしれないちょっと詳しい人に聞いている、くらいの温度感が丁...
  - anond:20240910183721
    自分が正誤の判断できる分野でやらんとゴミが出来るだけだろ
    - anond:20240913105456
      おまえは若い頃、会社の先輩が言ったことをゴミだと思ってたのか？あるいはなんでも完璧な回答をくれる完全人間だと思ってたのか？知らない分野に関して聞くときの、今のLLMとの...
      - anond:20240915092823
        うるさいなあ泥団子食べて黙っとけっ🟤 はらいっぱいクエ！
        anond:20240915092947
        おらぁ、トキだ、、、
- anond:20240910092816
  ワイは増田で長文が流れてきてもそもそも読まないやで。
- anond:20240910092816
  論文読ませたら、先行研究を論文本体の結論としてまとめてて、こりゃ使えんわとなった。冒頭にあるからね、先行研究
  - anond:20240911012919
    abstractが優先されないの？😟