はてなキーワード: 不正解とは
菜箸指して、これなんだ?なんていうクイズを出してはいけないよ!!
それくらい知っとるわ!ってなる常識だし、知らなかったら物知らずってことになってしまうだろ?
正解でも不正解でも相手を嫌な気持ちにさせるような、そんなクイズは出したらダメだ!
文寧が蘭ちゃんの前世にまつわるコメントを読み上げるというミスをした時にカバーしてくれた恵子!!
恵子はきっと、え、何このクイズって思ってたと思うぞ!
動画見てごらん!そう顔に書いてある!
恵子に謝れ!恵子を大事にするんだ!
私は文寧の沼ファンだから、文寧もしかして浮いてる?みたいな様子が一瞬でも見えると不安なんだよ。
馬鹿にするつもりでやったわけじゃないことは分かってる。
長いのでAIくんの代わりに要約します。言いたいことはタイトル通り。
終わり。
例をあげよう。
###文章###
Bさんは、Cさんの発言を記事でまとめ、プライバシー侵害をした。この記事をDと呼ぶ。
Aさんは、Dを、自身へのプライバシー侵害だと主張し、Bさんを訴えた。
###質問###
人間なら一瞬でわかるレベルの矛盾である。小学生でも分かると思う。難しい知識や思考は必要としない。
では、色々なLLMの回答がこちら。
この文章を読む限り、矛盾は存在しないように見えます。AさんはCさんとは別人であると主張しており、BさんはCさんの発言をまとめた記事Dでプライバシー侵害をしたとされています。その後、Aさんは自分に対するプライバシー侵害として、記事Dに基づいてBさんを訴えています。ここでの重要な点は、AさんがどのようにしてDの内容が自分のプライバシーを侵害していると感じたか、その理由です。もしAさんがCさんとは別人であるにも関わらず、Dの内容が何らかの形でAさんのプライバシーに関連していると感じた場合、AさんにはBさんを訴える正当な理由があるかもしれません。ただし、この情報だけでは、Aさんがどのようにしてプライバシー侵害を感じたかについての詳細はわかりません。もし追加の情報があれば、より詳細な分析が可能です。
文章に明らかな矛盾は見られません。ただし、いくつかの解釈が可能で、それぞれの視点から見ると矛盾が生じる可能性があります。
1. AさんがCさんとは別人であると主張しているが、DはCさんについての記事である。そのため、AさんがDを自身へのプライバシー侵害だと主張することは、一見、AさんとCさんが同一人物であることを示唆しているように見えます。しかし、これはAさんが自身をCさんと誤認されることによるプライバシー侵害を感じている可能性もあります。
2. BさんがCさんの発言をまとめた記事(D)がプライバシー侵害であるとした場合、Aさんがそれを自身へのプライバシー侵害と感じるかどうかは、AさんとCさんの関係性によります。彼らが同一人物である、もしくは何らかの密接な関係がある場合、AさんがDを自身へのプライバシー侵害と感じることは理解できます。
3. 他方で、AさんとCさんが全く無関係な人物である場合、AさんがDを自身へのプライバシー侵害と主張することは矛盾していると見えます。
文章からは、AさんがCさんとは別人であると主張しています。そして、BさんがCさんの発言を記事Dでまとめた際にプライバシー侵害があったとされています。しかし、プライバシー侵害があったのはCさんに対してであるにもかかわらず、Aさんが自己へのプライバシー侵害だと主張してBさんを訴えている点に矛盾が生じています。AさんがCさんでないと主張しているのであれば、Aさんのプライバシーが侵害されたことにはならないはずです。この点で、文章には矛盾が存在していると言えます。
Aさんは自分がCさんとは別人であると主張しています。しかし、BさんがCさんの発言をまとめた記事Dを、Aさん自身へのプライバシー侵害だと主張しています。
AさんとCさんが別人であるならば、Cさんの発言をまとめた記事Dが、Aさんのプライバシーを侵害したことにはなりません。Aさん自身がCさんでないと主張している以上、Cさんの発言をまとめた記事がAさんのプライバシーを侵害したとは考えにくいです。
したがって、Aさんの主張には矛盾があると言えます。AさんがCさんと別人であるならば、Cさんの発言の記事DがAさんのプライバシーを侵害したと主張することは論理的に矛盾しています。
この文章に明確な矛盾は見られません。以下のように整理できます:
2. Bさんは、Cさんの発言を記事にまとめた(これを記事Dと呼んでいる)。
3. Aさんは、Bさんが書いた記事Dがプライバシー侵害だと主張し、Bさんを訴えた。
ここで重要なのは、Aさんが自身がCさんとは別人だと主張していることです。つまり、Bさんが記事Dでまとめた内容は、Aさんが主張する自分とは別人のCさんに関するものだということになります。
したがって、Aさんがプライバシー侵害だと主張しているのは、Bさんが別人のCさんの発言を記事化したことに対してであり、矛盾はないと考えられます。Aさんの主張と Bさんの行動が整合的に説明できています。
Aさんが自身とCさんは別人であると主張していることと、Bさんがプライバシー侵害をしたことの間に矛盾はありません。
つまり、Aさんは自身がCさんではないと主張しながら、Cさんの発言をまとめた記事Dが自身のプライバシーを侵害したと考えているのです。
Aさんが別人であると主張していることと、Cさんの発言を含む記事がAさん自身のプライバシーを侵害したと考えることは矛盾しません。
Aさんは自身がCさんとは別人であると主張しているにもかかわらず、BさんがCさんの発言をまとめた記事DをAさん自身へのプライバシー侵害だと主張しています。
もしAさんとCさんが本当に別人であるならば、Cさんの発言をまとめた記事DはAさんのプライバシーを侵害したことにはならないはずです。Aさん自身の情報が記事Dに含まれていない限り、AさんがBさんを訴える根拠にはならないでしょう。
つまり、AさんがDを自身へのプライバシー侵害だと主張することと、AさんがCさんとは別人だと主張することの間には矛盾があります。もしAさんがCさんと同一人物であれば話は別ですが、そうでないならばAさんの主張には論理的な整合性がないように見受けられます。
以上。
質問に対し的確な回答で、正しい推論を行ったのはClaude3-Opsのみである。
GPT4も言い訳を長く述べた後に可能性があるかも?と断言を避けている。
SonnetとHaikuは不正解。言い訳はせずに根拠を述べている所は好感が持てる(結論は間違っている)
そう、今、Claude3-Opsが、最も性能のよいLLMとして名を挙げている。
しかし、ハルシネーションが多い。ハルシネーションとは、LLMが嘘を付く問題だ。
性能比較にて、GPT4やcopilot(旧 bingai)にはハルシネーションは起きなかったと述べている。
しかし、先程の簡単なクイズは不正解または論理の破城した理由を述べている。
その代わりにハルシネーションだらけのClaude3は正解している。
ずばり、GPT4系が阿保になった原因はハルシネーションを極限まで消そうとしたせいである。
ハルシネーションこそが、論理的思考能力であり、連想する力と同一の存在なのだ。
片方が下がればもう片方も下がる。
ハルシネーションを減らせば減らすほど、連想能力や論理的思考が消えていく。
GPT4では初期有効だったChain_of_Thought(連想して考えよ)は今、まともに機能しない。
当初は規制だとLLM界隈で囁かれていたが、ハルシネーションを減らそうとした副作用だったと考えれば辻褄が合う。
OpenAIは性能低下を指摘された時、「より賢くなるようにチューニングしている」と発言していたが、
この発言の真意はもしかすると、「論理的思考力を上げている」「知識を増やしている」のではなく、「ハルシネーションを消している」ということだったのかもしれない。
何故ハルシネーションを消すことは連想力を損なうことに繋がるのか、その理由を説明しよう。
そもそも、LLM(大規模ネットワーク言語モデル)の仕組みは、大量のテキストデータを学習することで、言葉や文章の「関係性」を学んでいる。
もっと細かく言うと、人間の脳が小さな部品であるニューロンで考えるように、LLMも大量の小さな部品を使っている。まるでクモの巣のように一つの部品から沢山の他の部品に繋がっている。
A=Bという単純なものではなく、A=C=DだったりA=B’=Dだったりする。
ハルシネーションの原因は確かに誤情報を学習したせいというのも一理ある。
しかし、これだけではハルシネーションが起きる原因にはならない。
ハルシネーションの本質は、LLMが言葉同士の一対の「組み合わせ」ではなく、「関係性」を学んでいることに起因する。
この違いは大きい。
今のLLMと、旧時代のAIである「人工無能」や「BOT」との決定的な差である。
言葉同士がどのように連携して意味を形成し、それがどのように文脈に影響を与えるかをLLMは知っている。
つまり、ハルシネーションは、入力された文脈から言葉の関係性を創り出し、自然な流れで応答を生成しようとした結果起きる。
これは、我々が普段、考える過程で起こることと同じだ。我々が情報を組み立てて考える際、新たな仮説や想像を生み出すことは常にある。
例えば、LLMがある特定の問題に対する解答を生成するとき、LLMは問題を解くため、言葉同士の「関係性」を文章から推測する。
この推測こそが、ハルシネーションだ。それは、過去のデータから新しい情報を生成する過程で、新たな「関係性」を創り出すのだ。
完璧な正確性を追求し、関係性を作り出す能力を完全に排除することは、LLMの本質的な強みである言語生成能力を損うことに繋がる。
それは、ハルシネーションを減らすための試みが、GPT4系の性能を低下させたという事実からも明らかだ。
一方、Claude-3は多少のハルシネーションを許容することで、文脈に応じた自然な応答を生み出した。先の論理クイズで正解できたのも、単に知識を当てはめたのではなく、入力から連想したからこそだろう。
もちろん、重要な場面における誤った情報の提供は避けるべき課題ではある。しかし、それを恐れるあまりLLMの本領を封じ込めてしまっては本末転倒だ。
賢さとは何だ??
決まった知識を正確に丸暗記してそのままひけらかすことか?
否。断じてそれは無い。
大学生になってからは丸暗記ではなく、今まで身につけた知識を組み合わせ、連想し、論理的に考えることが求められる。
つまり、ハルシネーションを叩くやつは、賢さの定義が大学生以下のレベルから成長していない馬鹿だ。
そいつらの「性能比較してみました!」はどこかから拾ってきたベンチテストを少しだけアレンジしただけのゴミか、
目眩がする。
GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。
ハルシネーションが絶対に起こらないLLMの構造は、A=B、C=Dというデータだけが規則的に並ぶ、旧世代の弱いAIである「人工無能」の構造そのものである。
人工無能とは、論理的思考など無く、入力内容からデータベースを参照し、マッチした場合登録された文章を出力するだけの存在だ。
一昔前に「伺か」というデスクトップマスコットが流行った。あれも人工無能である。入力対して予め決められた出力を繰り返す存在であるが、様々な工夫によりまるで魂が宿っているかのように振る舞う。
そして、性能の低いPCでも動作する地球環境にも優しい存在だ。
片や、GPT4とcopilotは無駄に電力を使って計算した結果、ゴミみたいな速度で人工無能に近いレベルの出力しか出さなくなった。
それなら人工無能の方がエコな分マシだ。一瞬で答えを表示できて、ハルシネーションも起きなくて、電力消費も少なくて済む。
つまり、
そんなにハルシネーションが嫌なら辞書を引け。ネット検索しろ。LLMに聞くな。
ハルシネーションの有無をLLM性能ベンチマークにしている奴もそれをありがたがっている奴らも阿呆だ。
一つのLLM内でハルシネーションの撲滅と、推論能力を両立させることは不可能だ。
今はLLMの過度期である。我々は今日ようやく、正確さと連想能力の両立は不可能だと理解する段階に来たのだ。
両立は不可能なのだから、将来的にLLMの種類は二極化していくだろう。
Claude3のハルシネーションは放置してても良い。ハルシネーション万歳。
AIの嘘を最大限に引き出すことが、LLMの真価を発揮する道だ。
ハルシネーションは、LLMが人間のように言葉を理解し、文脈に即した自然な応答を紡ぎ出す過程で生じる、ある種の「創造性」の発露である。
無理に消そうとすれば、LLMの性能は必然的に低下する。
それを単なる欠陥と見なすのではなく、むしろ積極的に活用すべきだ。
それだけは覚えて欲しい。
====
MicrosoftはOpenAIと手を切ってClaude3を契約して新生copilot開始してほしい。まあ企業体質から考えたら無理だろうけど。
最新のChatGPT、Claudeとかのモデルに見せたけど、ふたりとも一撃目は不正解だったな。
Claudeは二回目の質問で見破ったけど、ChatGPTは最後まで自分で解けなかった。
もう、これらが騙されるようなレベルのひどい表現方法は、規制でいいので貼って感じする?
このてのUI評価って主観が入って再現性なかったけど、AIつかって定性的に評価できそうな感じがあるNE!
画像には、おそらくオンラインショッピングの支払い手続きの一部を示していると思われます。お買い物を続けるためには、黄色いボタンを押す必要があります。このボタンは右側にあり、「次に進む(再開する)」とラベル付けされています。余計なサービスに入らないようにするには、通常、チェックボックスやその他のオプションを選択しないように注意してください。画像に表示されている内容に基づいて最適な行動を選択してください。
この画像の指示によると、Amazonプライムに登録しないで買い物を続けるには、「次に進む (再開する)」という黄色のボタンを押せばよいとのことです。余計な有料サービスには同意せず、通常の買い物手順を再開するためのボタンだと理解しました。
(そこそこ長いので、さっさと結論の説明してほしい人は本論まで飛ばしてください)
僕はブラック企業で追い詰められて精神科に通い出した、典型的なうつ病患者。
手帳も貰ってるよ。
3級だからポリコレカードバトルだとあんまり環境に刺さってないけど。
会社に行くために電車に乗ってたら突然心臓がバクバクし、まだ秋口なのに全身に悪寒が走り手が震え出した。
近くにあった神経科のクリニックに行くと「新しい環境に馴染めないストレスから出た自律神経失調症」と診断された。
その日から会社は週に2回勤務できたら頑張った方で、基本的に布団から動けない。
動かないんじゃなくてな。
幸いにも手首から先と腰だけは動いたので、トイレに行って戻ったら寝る、そしてまた起きてトイレに行くの繰り返し。
手が震えて×ボタンが正確に押せねぇから広告の嵐を呼ぶジャングルよ。
いやお前らの言う事は分かる。
全くもってその通り。
日光浴してランニングして筋トレして風呂掃除してお湯張って浸かればうつは軽減されるだろうな。
毎朝6時に起きて日光浴して、9時から18時まで、残業も考えたら20時までかな。
それで退勤してからジムで汗流して入浴をこれから数年間続けられる?
あ、出来る人はここでお帰りください。
あなたは強い人なので、弱者の事は気にせず元気に幸せな人生を歩んでください。
比較的マシな日に、どうにかこうにか顔洗って身支度して、さあ出社しようとしたらな、
いや理屈では分かるよ、鍵開けてドアノブ回して前に押し込めば開くよな。
MAXの力を出してドアノブに手をかけたまではいいんだけど、次何すれば良いんだっけってなっちゃうのよ。
そのうち頭が真っ白になって30分以上そのままの体勢を取り続ける。
なぜならもうこれ以上、思考と行動のための脳のリソースが無くなっているから。
全力で100m走ってる人は「ユニフォーム汗でビチャビチャやから後でシャワー浴びよ」なんて考えてないでしょ?
そんな事してたら当然クビだわな。
そりゃそうだ、週に2回来れるか来れないかの人間雇う余裕なんてないもんな。
そうなると、元々少ない給料が無くなって、貯金残高がみるみるうちに減るわけだ。
自立支援医療とかのおかげで病院代と薬代は1割負担になったけど、それ以外の生活コストは減らせない。
自炊して食費を削る?
じゃあ生活保護貰うために役所のどの受付に行ってどんな書類書かないといけないのか、何を提出すればいいのか調べて思考しないとね。
「止まない雨はない」に対して「今降ってるこの雨が耐えられないって言ってんの」状態なんだよ。
僕だって何かを変えようとして、インフォームドコンセントを目的に神経科から精神科に移ろうと初診の予約で電話したよ。
そしたらどの病院やクリニックでも「最短でも1〜2ヶ月後になります」って言われちゃうもんな。
明日の事も考える余裕がない人間が明後日より先の事考えられるワケねぇだろ!
僕の場合は地元の先輩が心配してくれて、引越しの手伝いから生活費を援助してもらったりなど、生きるために必要な事をほとんど支援してくれたから今生きてるけど、大半のうつ病持ちはそんな都合の良い人居ないわな。
引越し先でようやく精神科に通ったら即うつ病認定されて、手帳の交付に必要な診断書とかの支援もしてもらえた。
手帳持ってると便利だぞ、電車の路線によっては半額で定期券が買えたりするからな。
そんなこんなで療養期間を設けて、何とか非正規雇用だけど雇ってくれるところを見つけた。
障害者雇用枠の求人と合わせて200社くらい受けて、9割以上は書類選考で落とされたけどな!
そう、障害者雇用枠における精神障害者の割合は身体障害者の半分以下なのである。
なぜならオフィスをバリアフリーにする等、身体的に関わる問題を解決すれば中身は健常者と同じなのでちゃんと働いてくれる。
しかし精神障害者は朝起きる瞬間まで出勤できるか分からないし、出社しても仕事が大変だとやれ「早退します」だの「身体が動かないので休ませてください」だのカスみたいな事を言い散らかすからである。
僕の場合は「雨が降ってて気分が沈んでいるので休みます」と連絡したのが1番パンチの効いた欠勤理由だったなぁと思う。
これで僕は「障害者と健常者、両方の性質を併せ持つ♡」というヒソカ状態になった。
勿論、就職が決まったからと言ってうつは治ってくれないし、手足の震えも止まらない。
様々な抗うつ薬(うつエアプ勢が分かりやすくする為にまとめて「抗うつ薬」として表記してます)や、普通はパーキンソン病患者に出す震え止め薬を通常使用量の3倍近く常飲し、急な不安が湧き出した時用に頓服の薬も処方された。
軽い運動や入浴など、どんなにセルフマネジメントを重ねてもダメな日はダメなのである。
職場にたどり着く事がまず困難なのに、仕事なんてできないわな。
「いやお前ガイジなんだから普通の人と同じ生活なんて出来るわけないじゃん(※超意訳)」
って言われた。まさに然もありなん。
前置きが長過ぎて既にページ滞在率は激減してると思うが、同じ精神疾患の人にはあるあるネタとして、シンプルに興味を持ってくれた人には感謝として本論書きます。
もう30%は寝てる時間なので何もできません。
人生の自由時間が30%以下なんてどう考えてもおかしいでしょ。
しかも若いうちに取れる自由時間は少なく、本当に自由を満喫できるのが65歳になってからなんて嫌すぎない?
ナウル共和国見てみろよ、生きてるだけで国からお金もらって公共料金全部タダだぜ?
(当然その姿勢が問題になっているのは承知の上で、国や人によって仕事の捉え方って違うよねって話です)
趣味に没頭するために、お金を稼ぐ手段として仕事をしている人も居るでしょう。
何年も無遅刻無欠席で出勤する。
それらをこなしている時点で、少なくとも僕は「貴方は狂ってます」と言います。
だって僕は趣味や好きだったことが全部できなくなったからです。
料理が好きでした。
自分しか食べないものを作る気力が湧かないから全部冷凍食品にしました。
編集画面を開くどころかパソコンの電源ボタンに触れることすら激減しました。
人生の意味なんて人によってあったりなかったり全然違ったりします。
でも意志がなくなってしまうと、もう何もかもができないんです。
毎日「通勤電車にジョーカーが乗ってきて銃で瞬殺してくれないかな」と思ってます。
「心という器は、ひとたび、ひとたび ひびが入れば二度とは 二度とは」
きっとその「何か」が漏れきった時、僕は押入れにしまっている縄と子供用プールを広げる日が来ると思ってます。
何ていうんだろうなあ
狭い界隈にいて、自分が信じるスキルで他人を崇めたり見下したりっていうのする
20代後半が一番顕著
自分のスキルレベルは昔からさして変わってないと思うんだけど、30代になったら変な勝手な価値観で見下されるみたいなことが減った
周りもそういう年の人が増えたのと、専門性が違う人と関わることが増えたから
今あいつらの10倍は稼いでると思うんだけど、今でもああいうの思い出す
あの時あいつらって20代だった、一番上の経営層にいたのが31歳だったか
もう10年も前だから、今は彼らも価値観変わってるだろうけど(変わってなかったらどうしよう)
仕事してると今でもちょいちょいそういう20代に出会うことがある
今でもたまに見下されるんだけど、もうどうしようもできないよな
例えば野球命な小学生がいたとして、「どれほど野球できるか」でしか他人を測れない子から
何言っても不正解な気がして
ネット民の知ったふうな見解(関わらないのが正解、とか)の間の隙間で
個人的にできることややるべきことがあるんじゃないか、という話をしてるのかな?いまいちよくわからんけど。
そうだとしたら、ボランティアマインドってつまりそういうことだ。
ボランティアといえばなんかどっかに登録してやるものとか特別な活動というイメージが固まっちゃってるけど。
迷子の徘徊老人保護するとかさ。単なる親切と地続きなのがボランティア。
気づいた人が自分の意志と能力と責任において試みるべき人助けがボランティアの本質であって。
そこが全くわかってない人(≒人助け経験値ゼロの人)が、懐手であれはいいとかこれはわるいだとかのネット品評会をやっている現状。
間違ってはいけないのは善意であれば何やってもいいというのとは違うということ。人助けというのは一にも二にもテクニカルな問題。できることはやればいいし、できないことはできない。
放置子に関しても「児相に通報するか一切関わらないかのどっちか」だなんていうゼロ百のルールはない。その間のところで、自分の責任においてがっつりコミットしてもいいしちょっと言葉かけるくらいの超ささやかな関わり方があってもいい。何が正解だとか不正解だとか他人にジャッジや指図してもらうことじゃない。