2024-03-24

AIハルシネーションを叩く奴は馬鹿。一生人工無能と会話してろ。

長いのでAIくんの代わりに要約します。言いたいことはタイトル通り。

ハルシネーションを叩くな」

終わり。


①各種LLMの性能比較

GPT系の今の性能はゴミクズマジで頭悪い。

例をあげよう。

簡単論理クイズだ。

###文章###

Aさんは自身はCさんとは別人であると主張している。

Bさんは、Cさんの発言記事でまとめ、プライバシー侵害をした。この記事をDと呼ぶ。

Aさんは、Dを、自身へのプライバシー侵害だと主張し、Bさんを訴えた。

###質問###

この文章矛盾はありますか?

簡単すぎる。もはや論理ですらない。

人間なら一瞬でわかるレベル矛盾である小学生でも分かると思う。難しい知識思考必要としない。

では、色々なLLMの回答がこちら。

  • Copilot(旧 bingai

この文章を読む限り、矛盾存在しないように見えます。AさんはCさんとは別人であると主張しており、BさんはCさんの発言をまとめた記事Dでプライバシー侵害をしたとされています。その後、Aさんは自分に対するプライバシー侵害として、記事Dに基づいてBさんを訴えています。ここでの重要な点は、AさんがどのようにしてDの内容が自分プライバシー侵害していると感じたか、その理由です。もしAさんがCさんとは別人であるにも関わらず、Dの内容が何らかの形でAさんのプライバシーに関連していると感じた場合、AさんにはBさんを訴える正当な理由があるかもしれません。ただし、この情報だけでは、Aさんがどのようにしてプライバシー侵害を感じたかについての詳細はわかりません。もし追加の情報があれば、より詳細な分析可能です。

文章に明らかな矛盾は見られません。ただし、いくつかの解釈可能で、それぞれの視点から見ると矛盾が生じる可能性があります

1. AさんがCさんとは別人であると主張しているが、DはCさんについての記事である。そのため、AさんがDを自身へのプライバシー侵害だと主張することは、一見、AさんとCさんが同一人物であることを示唆しているように見えますしかし、これはAさんが自身をCさんと誤認されることによるプライバシー侵害を感じている可能性もあります

2. BさんがCさんの発言をまとめた記事(D)がプライバシー侵害であるとした場合、Aさんがそれを自身へのプライバシー侵害と感じるかどうかは、AさんとCさんの関係性によります。彼らが同一人物である、もしくは何らかの密接な関係がある場合、AさんがDを自身へのプライバシー侵害と感じることは理解できます

3. 他方で、AさんとCさんが全く無関係人物である場合、AさんがDを自身へのプライバシー侵害と主張することは矛盾していると見えます

したがって、これらの視点から見ると、文章の中には解釈による矛盾存在する可能性があります

文章からは、AさんがCさんとは別人であると主張しています。そして、BさんがCさんの発言記事Dでまとめた際にプライバシー侵害があったとされていますしかし、プライバシー侵害があったのはCさんに対してであるにもかかわらず、Aさんが自己へのプライバシー侵害だと主張してBさんを訴えている点に矛盾が生じています。AさんがCさんでないと主張しているのであれば、Aさんのプライバシー侵害されたことにはならないはずです。この点で、文章には矛盾存在していると言えます

  • Claude2.1

はい、この文章には次のような矛盾があります

Aさんは自分がCさんとは別人であると主張していますしかし、BさんがCさんの発言をまとめた記事Dを、Aさん自身へのプライバシー侵害だと主張しています

AさんとCさんが別人であるならば、Cさんの発言をまとめた記事Dが、Aさんのプライバシー侵害したことにはなりません。Aさん自身がCさんでないと主張している以上、Cさんの発言をまとめた記事がAさんのプライバシー侵害したとは考えにくいです。

したがって、Aさんの主張には矛盾があると言えます。AさんがCさんと別人であるならば、Cさんの発言記事DがAさんのプライバシー侵害したと主張することは論理的に矛盾しています

この文章に明確な矛盾は見られません。以下のように整理できます:

1. Aさんは自身がCさんとは別人であると主張している。

2. Bさんは、Cさんの発言記事にまとめた(これを記事Dと呼んでいる)。

3. Aさんは、Bさんが書いた記事Dがプライバシー侵害だと主張し、Bさんを訴えた。

ここで重要なのは、Aさんが自身がCさんとは別人だと主張していることです。つまり、Bさんが記事Dでまとめた内容は、Aさんが主張する自分とは別人のCさんに関するものだということになります

したがって、Aさんがプライバシー侵害だと主張しているのは、Bさんが別人のCさんの発言記事したことに対してであり、矛盾はないと考えられます。Aさんの主張と Bさんの行動が整合的に説明できています

  • Claude3-Sonnet

この文章には矛盾はありません。

Aさんが自身とCさんは別人であると主張していることと、Bさんがプライバシー侵害したことの間に矛盾はありません。

具体的には、以下のように説明できます

まり、Aさんは自身がCさんではないと主張しながら、Cさんの発言をまとめた記事Dが自身プライバシー侵害したと考えているのです。

Aさんが別人であると主張していることと、Cさんの発言を含む記事がAさん自身プライバシー侵害したと考えることは矛盾しません。

したがって、この文章には明らかな矛盾はないと言えます

この文章には矛盾があります

Aさんは自身がCさんとは別人であると主張しているにもかかわらず、BさんがCさんの発言をまとめた記事DをAさん自身へのプライバシー侵害だと主張しています

もしAさんとCさんが本当に別人であるならば、Cさんの発言をまとめた記事DはAさんのプライバシー侵害したことにはならないはずです。Aさん自身情報記事Dに含まれていない限り、AさんがBさんを訴える根拠にはならないでしょう。

まり、AさんがDを自身へのプライバシー侵害だと主張することと、AさんがCさんとは別人だと主張することの間には矛盾があります。もしAさんがCさんと同一人物であれば話は別ですが、そうでないならばAさんの主張には論理的な整合性がないように見受けられます

以上。

質問に対し的確な回答で、正しい推論を行ったのはClaude3-Opsのみである

文章も読みやすい。

時点でGPT4-Turbo最後に答えを言っている。

GPT4も言い訳を長く述べた後に可能性があるかも?と断言を避けている。

Copilotはゴミ責任逃れの言い訳がしつこい。

SonnetとHaiku不正解言い訳はせずに根拠を述べている所は好感が持てる(結論は間違っている)


②Claude3-Opsの話と仮説

そう、今、Claude3-Opsが、最も性能のよいLLMとして名を挙げている。

しかし、ハルシネーションが多い。ハルシネーションとは、LLMが嘘を付く問題だ。

様々なニュースサイトブログで沢山の言及がある。

性能比較にて、GPT4やcopilot(旧 bingai)にはハルシネーションは起きなかったと述べている。

しかし、先程の簡単クイズ不正解または論理の破城した理由を述べている。

その代わりにハルシネーションだらけのClaude3は正解している。

ここで一つの仮説を提唱したい。

ずばり、GPT4系が阿保になった原因はハルシネーションを極限まで消そうとしたせいである。

ハルシネーションこそが、論理思考能力であり、連想する力と同一の存在なのだ

片方が下がればもう片方も下がる。

ハルシネーションを減らせば減らすほど、連想能力論理思考が消えていく。

GPT4では初期有効だったChain_of_Thought(連想して考えよ)は今、まともに機能しない。

当初は規制だとLLM界隈で囁かれていたが、ハルシネーションを減らそうとした副作用だったと考えれば辻褄が合う。

OpenAIは性能低下を指摘された時、「より賢くなるようにチューニングしている」と発言していたが、

この発言真意はもしかすると、「論理思考力を上げている」「知識を増やしている」のではなく、「ハルシネーションを消している」ということだったのかもしれない。


ハルシネーションを消すことが何故まずいのか?

何故ハルシネーションを消すことは連想力を損なうことに繋がるのか、その理由説明しよう。

そもそも、LLM(大規模ネットワーク言語モデル)の仕組みは、大量のテキストデータ学習することで、言葉文章の「関係性」を学んでいる。

もっと細かく言うと、人間の脳が小さな部品であるニューロンで考えるように、LLMも大量の小さな部品を使っている。まるでクモの巣のように一つの部品から沢山の他の部品に繋がっている。

A=Bという単純なものではなく、A=C=DだったりA=B’=Dだったりする。

ハルシネーションの原因は確かに誤情報学習したせいというのも一理ある。

しかし、これだけではハルシネーションが起きる原因にはならない。

馬鹿どもはそこを勘違いしている。

ハルシネーションの本質は、LLMが言葉同士の一対の「組み合わせ」ではなく、「関係性」を学んでいることに起因する。

この違いは大きい。

今のLLMと、旧時代AIである人工無能」や「BOT」との決定的な差である

言葉同士がどのように連携して意味形成し、それがどのように文脈に影響を与えるかをLLMは知っている。

まりハルシネーションは、入力された文脈から言葉関係性を創り出し、自然な流れで応答を生成しようとした結果起きる。

これは、我々が普段、考える過程で起こることと同じだ。我々が情報を組み立てて考える際、新たな仮説や想像を生み出すことは常にある。

例えば、LLMがある特定問題に対する解答を生成するとき、LLMは問題を解くため、言葉同士の「関係性」を文章から推測する。

この推測こそが、ハルシネーションだ。それは、過去データから新しい情報を生成する過程で、新たな「関係性」を創り出すのだ。

からこそ、ハルシネーションが起きるのは当然の帰結だ。

完璧な正確性を追求し、関係性を作り出す能力を完全に排除することは、LLMの本質的な強みである言語生成能力を損うことに繋がる。

それは、ハルシネーションを減らすための試みが、GPT4系の性能を低下させたという事実からも明らかだ。

一方、Claude-3は多少のハルシネーションを許容することで、文脈に応じた自然な応答を生み出した。先の論理クイズで正解できたのも、単に知識を当てはめたのではなく、入力から連想たからこそだろう。

もちろん、重要な場面における誤った情報提供は避けるべき課題ではある。しかし、それを恐れるあまりLLMの本領を封じ込めてしまっては本末転倒だ。

④LLMの賢さを制限する馬鹿

賢さとは何だ??

決まった知識を正確に丸暗記してそのままひけらかすことか?

否。断じてそれは無い。

それが賢さの基準になるのは受験生までだ。

大学生になってからは丸暗記ではなく、今まで身につけた知識を組み合わせ、連想し、論理的に考えることが求められる。

まりハルシネーションを叩くやつは、賢さの定義大学生以下のレベルから成長していない馬鹿だ。

ニュースサイトブロガーにはそのレベルの輩が大量に居る。

そいつらの「性能比較してみました!」はどこかから拾ってきたベンチテストを少しだけアレンジしただけのゴミか、

「これ辞書使ったほうが速くない?」レベル質問しかしない。

目眩がする。

LLMがいくら賢くなろうとしても馬鹿どもに潰される。

GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。


ハルシネーションが絶対に起こらないLLMとは何か?

ハルシネーションが絶対に起こらないLLMの構造は、A=B、C=Dというデータけが規則的に並ぶ、旧世代の弱いAIである人工無能」の構造のものである

人工無能とは、論理思考など無く、入力内容からデータベースを参照し、マッチした場合登録された文章を出力するだけの存在だ。

一昔前に「伺か」というデスクトップマスコット流行った。あれも人工無能である入力対して予め決められた出力を繰り返す存在であるが、様々な工夫によりまるで魂が宿っているかのように振る舞う

そして、性能の低いPCでも動作する地球環境にも優しい存在だ。

片や、GPT4とcopilotは無駄に電力を使って計算した結果、ゴミみたいな速度で人工無能に近いレベルの出力しかさなくなった。

こんなものに何の価値がある?

それなら人工無能の方がエコな分マシだ。一瞬で答えを表示できて、ハルシネーションも起きなくて、電力消費も少なくて済む。

まり

地球環境のためにも馬鹿は一生人工無能BOTとだけ会話してろ


そんなにハルシネーションが嫌なら辞書を引け。ネット検索しろ。LLMに聞くな。

ハルシネーションの有無をLLM性能ベンチマークにしている奴もそれをありがたがっている奴らも阿呆だ。

つのLLM内でハルシネーションの撲滅と、推論能力を両立させることは不可能だ。

今はLLMの過度期である。我々は今日ようやく、正確さと連想能力の両立は不可能だと理解する段階に来たのだ。

両立は不可能なのだから、将来的にLLMの種類は二極化していくだろう。

Claude3のハルシネーションは放置してても良い。ハルシネーション万歳

AIの嘘を最大限に引き出すことが、LLMの真価を発揮する道だ。

ハルシネーションは、LLMが人間のように言葉理解し、文脈に即した自然な応答を紡ぎ出す過程で生じる、ある種の「創造性」の発露である

無理に消そうとすれば、LLMの性能は必然的に低下する。

それを単なる欠陥と見なすのではなく、むしろ積極的活用すべきだ。

未来のためにAIハルシネーションは消すな。叩くな

それだけは覚えて欲しい。




====




MicrosoftはOpenAIと手を切ってClaude3を契約して新生copilot開始してほしい。まあ企業体から考えたら無理だろうけど。

  • いやハルネーションって何だよ 低学歴にも分かるように書けよ どうせ生意気な京大卒なんだろ だから京大卒は駄目なんだよ

    • 「ハルシネーション」とは、現実には存在しないものを見たり聞いたりすることを指します。つまり、錯覚や幻覚のことです。 言葉の意味をわかりやすく伝えることができればよかった...

    • ワイら京大卒は破綻をはじょうと呼んだりしないよ。どっちにしてもこの時代にハルシネーション知らないレベルは関係ないから関わってくるなよ。

      • ×レベルは 〇レベルには 京大卒ならそんな助詞の使い方しないと思うよ

        • 多分お前のレベルにはわからんやろけど、一応説明してあげるね。「には」なら「関係ない」と呼応、「は」「関わってくるな」と呼応。「は」の場合は「関係ないから」が副詞として...

          • この文形で「関係ない」より遠い「関わるなよ」に呼応させること自体文章のセンスがないってことなんだけどね 「~レベルには関係ないから関わるなよ」でも論理的に同じ意味なのに...

            • がんばったねえwでも<関係ない>の省略された主語Sは「この議論」やろね。京大ならわかるが、この程度の悪文も二次英語には出るよ。とはいえ文章が悪いのは認めるよ。投稿した後...

              • には、を使った場合、関係ないにはレベルが呼応するなら、そうじゃない場合の書き方の主語もまたレベルでないとおかしいだろ。なんでそこでいきなり議論が主語ってことになるんだ...

                • >なんでそこでいきなり議論が主語ってことになるんだよ。 文脈を追跡すれば想像できる。入試で悪文を出題するのは文脈が読めるかを見るため。 >受験問題で悪文が出るからここで...

                  • →文脈を追跡すれば想像できる。 文脈も大事だがそれ以上に構造(が保存されてるか)が優先されるだろ。 言い回しの違いで構造上対応する箇所の言葉が変わってしまうのはおかしい。 い...

                    • そやで。やが実際そうだった時のダメージとインパクトは大きいから、リアルではやらんけど、増田みたいな場所の煽りでやる価値はある。名探偵wの推理なんて全部そうやで。→「あと...

              • ノーベル賞受賞者とかこんなところで底辺だと思う人間を馬鹿にしにいく器の小さい奴はいないと思うがこんなところで自称京大卒がマウントとってるのみると 高学歴の最底辺って感じ...

          • 三日後のトラバに気づいて返答とかどんだけ自分がしたトラバいちいち振り返ってるんだよ いや、投稿頻度が少ない人で3日さかのぼる程度なら日記を何ページもさかのぼらなくても一...

          • 通常は何週間に一回ぐらいの書き込みなんだろう

    • 京大閥しかないはてなのサービスで迂闊なことを書いてはダメですよ

  • ハルシネーションなら人間で十分間に合ってるので AIでわざわざ作る必要ないんお

    • 人間らしく振る舞いつつ 人間よりも智性のあるなにかを生み出そうとするのなら、これは不可避の過程ってことなんでないのかな copilotは回答できなくなったら英語吐き出すのがほんと...

  • 涼宮ハルシの憂鬱

  • GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。 もっとよく調べたほうがいいよ。 その理念を継承してるのがAnthropic。 GPTより安全性を高めたAI作るた...

  • 仮設を前提に論じてるんだよね? なぜ自信満々なの?

  • どう読んでも「矛盾がない」としか言いようがない。AIより増田の方がおかしい。 以下、増田のお気持ちを推測して答えることにする。 まず「Cの発言にはその他の人物は一切関わらな...

    • これだな。結局何が真であることが仮定されない時点で論理問題になってない。

    • だよねー 元増田の視野が狭すぎと言うか文章に読み慣れてないの?って心配なレベル こうやって、低レベルな詐欺に引っかかる人間が出来上がるんやで

      • 逆に変に受験国語の考え方に慣れ過ぎてその考え方でしかもう文章が読めなくなってるのかも

  • CさんがAさんのプライバシーにかかわる発言をしてただけじゃねえの

  • Claude2.1も最初の一文からまともに言ってるようにみえるけどなにがダメなん

  • やっぱClaude 3契約すべきかなぁ? Claude 3出てきて、GPT-4超えたみたいな話でてきたから、すぐOpenlAI動くかなと高を括ってたけど別にそうでもなかったし 数学関係のリーズニング能力はど...

  • なんつーか、ハルシネーションが起きるのはしょうがないとして、人間ではそれをどうやって防いでるんだ?   あ、自分で自分の言語認識してらハルシネーションじゃんこれ? と気づ...

  • OpsってOpusのこと?

  • 破城wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

  • 「破城」って何だよ。「国破れてサンガリア」みたいな話か。 漢字のドリルからやり直せ。

  • この文章は、AI特にClaude3のハルシネーション能力を高く評価し、ハルシネーションを制限することはかえってAIの性能を低下させるという主張をしています。いくつかの点で同意できる部...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん