LLMの最重要論文とも言われる"Attention is all you need."の著者の一人の会社が出したモデル"Command R+"が性能が良くて話題になっていた。これもオープンソースだが、今のところこのモデルにも勝っている。このレベルのモデルがオープンソースであるということはとても価値がある。

ここ一、二ヶ月でようやくGPT-4 と互角に戦えるモデルが出てきた。一時期はClaud3がGPT-4を追い抜いた程だ（OpenAI が本気を出してGPT-4を強化して追い抜き返したんだけど）。もうGPT-4が出て１年が過ぎた。研究者やリソースなどは過去に類を見ない程注ぎ込まれたと思うが、GPT-4と同じ性能のモデルはほぼ１年経たないと出てこなかった。OpenAIの凄さがわかる。GPT-4か出てきた当初はあまりの性能の良さに本当にシンギュラリティが起きたんじゃないかと驚愕したが、一年使い続けると、粗やら推論能力の低さに気が付いてくる。今年中に出るであろう、GPT-5に期待だ。

LLMの性能リーダーボード（https://chat.lmsys.org/?leaderboard）

Permalink | 記事への反応(0) | 06:13

2024-04-18

■anond:20240418095610

やっぱり書いてない事を読んでるな。どこに「満足」なんて書いてあるの？

これもChat GPTに教えてもらえって煽るつもり？

凄いバイアス。絶望的だ。世界が鈍色に見えてそう

Permalink | 記事への反応(0) | 10:16

■anond:20240418093404

どこにもを「ChatGPT様のお通りじゃぁ〜！！！」と言う意図が読み取れる部分が無いんだけど。

「Chat GPTの答え」って回答例って意味でしょ普通に。

まさに確証バイアスじゃん。

自分のバイアスに気付いてない？

Permalink | 記事への反応(1) | 09:35

■問：以下の文章を読んで設問に答えよ

ある増田は、

数十年以上継続して続いている傾向が、今後も続いていくという予想とそれを裏付ける速報値
例外なく100%佐藤になるというアジテーターが作り上げた荒唐無稽の話

が同じレベルの話である、と認識してしまいました。

問題

- 問１：増田の歪んだ認知の根源になっていると思われる、思想信条について予測しなさい

問２：なぜこのような人間になってしまったのかを予想しなさい
問３：上記2問に基づいて、増田の様にならないためには何を心掛けるべきかあなたの感想を述べなさい

Chat GPTの答え

問１：思想 信条についての予測

増田が持つ思想信条には、おそらく確証バイアス（Confirmation Bias）が深く関与していると考えられます。このバイアスは、個人が自身の既存の信念や意見を支持する情報だけを選択的に受け入れ、反対または矛盾する情報を無視する傾向を指します。増田は数十年にわたるデータに基づく予測と、全く根拠のない極端な主張を同等に扱ってしまっているため、彼の信じたい内容に対する過度の執着が認識の歪みを生んでいる可能性があります。

問２：このような人間になってしまった原因の予測

この種の認知の歪みは、しばしば個人の過去の経験や育った環境、教育レベルに深く根ざしています。また、情報を取るソースが限定されているか、一方的な情報ばかりに晒され続ける環境にいると、こうした認知歪みが強化されることもあります。社会的な孤立やエコーチェンバー（同意見の人々だけで囲まれる環境）にいることも、現実の多様性を認識する能力を低下させる要因となり得ます。

問３：増田のようにならないための心掛け

増田のような認知の歪みを避けるためには、多角的な視点から情報を収集し、様々な意見に耳を傾けることが重要です。批判的思考を養うために、情報の出典を常に確認し、その信憑性やバイアスを考慮することが求められます。また、自分の信じたいものだけを信じるのではなく、異なる視点からの意見やデータにも開かれた心で接することが重要です。これには、教育や自己啓発を通じて常に学び続ける姿勢も含まれます。

このような対策を心がけることで、現代社会における情報の洪水の中でも、より健全でバランスの取れた視点を維持することができるでしょう。

Permalink | 記事への反応(1) | 09:08

■月2000円程度のサブスク教えて

1000円ならネトフリとかフールーとか色々あるけど

2000円前後はどうかな

格安SIM、U-NEXT、NHKくらいしか思いつかない

チャット GPTやダゾーンは3000円超えになってしまった

Permalink | 記事への反応(0) | 07:09

2024-04-14

■anond:20240414122744

最適化だけしてた人たちに頼んでたのがそのレベルだとGPTで済むようになってきたな

React+MUIのメニューの機能がどうのとか知ってるか知ってないかだけみたいなしょーもないのはChatGPTでいいわってなってる

Permalink | 記事への反応(0) | 12:32

2024-04-10

■欧州の電力市場で何が起きているか

考えをまとめるために書いているので長くなってしまった。

なので最初にChat GPT要約をおいとく。

要約

欧州の再生可能エネルギーは投資が好調：
- 投資が集中している状況、特に施設の製造、建設、運営の分野の安定が大きい
- 公的補助の縮小により再エネ施設の耐用年数が延長される→安定した資金調達につながっている
対して、既存電源は相対的に投資が集まらない。
- 欧州での原子力発電所新設計画への投資が集まらない
  - 再生可能エネルギーの台頭に、原子力発電は構造的に対応が困難
  - フランスの原子力発電所の採算割れ問題
  - 再生可能エネルギーと同じ構造を持つのに、再エネの低い限界費用に対抗できず
日本の状況と対策：
- 電力市場の安定化だけ見ればこのまま致命的な破綻には至らない。しかし国際競争力が落ちる。
- 安い電力になる再生可能エネルギーへのシフトは不可避。
- エネルギーコスト削減の必要性と、それに向けた対策の重要性。

再エネ以外に投資が来ない。

投資マネーが再エネに集まり、既存電源に行かない状況が続いている模様。

再生可能エネルギーは、施設の製造・建設・設置、さらに運営のノウハウが溜まってきて再エネが安定した投資先と見做されてきており、潤沢な資金供給が続いている。

例えば、利回りなども、再エネ設備の耐用年数を従来は20年などで計算していた。これは公的補助が20年だったと言う前提だが、次々と公的補助が終了した結果、耐用年数を30年以上で計算するところが増えていて、それらをミックスした投資商品が登場、安定した資金調達に繋がっているようだ。

一方で、相対的に既存電源に対する投資が減っている。欧州でもエネルギー安全保障の観点から、イギリス、フランスなどで原発の新規計画が出てる。

今時、国の金だけでやると言う計画をイギリスが建てるはずも無く、資金を募集しているのだが、全然投資が集まらなくてかなり苦戦している。

これとは別の話として、エネルギー安全保障の観点だと言っているのに、当初目論みの建設費で手を上げたのが中国企業（中国"系"ですらない、中国の国営企業）しかないと言う状況で、これだとまずいと言う事で、新規設置の原発が生み出す電力の買取保証価格をつり上げたところ、なんと再生可能エネルギーの2倍から3倍の価格になってしまって問題化している。

エネルギーの安定供給・安全保障の観点という点では色々な電源をミックスするのは当然で、そういう点では単価の高い電力が混ざっても仕方が無い。

が、その国のエネルギー価格は、その国の国際競争力に直結する。製造業はもちろんのこと、ITのデータセンターの立地、研究施設の立地など情報系にも影響してくる。

国策である程度電力価格をコントロールできるからと言って、上げれば今度は国際投資が逃げていくということで、苦しい状況が続いている。

既存電源の採算割れ

欧州と言うより主にフランスでの問題なのだが、フランスは原子力発電所で発電した電力を他の国に売ると言うビジネスを行っていた。

ところが、再生可能エネルギーが市場を荒らすようになってしまったため、もくろみが崩れてしまって採算性が悪化している。

既存電源と再生可能エネルギーの違いは何かと言うと、限界費用が全く違う。再生可能エネルギーは、燃料費がないと言うところが大きくて、0円以上で売却できれば利益になる。というか、勝手に発電されるので止める意味が無い。

そのため、他の電源では燃料費が上回って赤字になるケースでも電力を市場に流す事ができる。そんなものと価格競争しても意味が無いので、例えば火力発電所は再エネの供給が大きくなったら発電を止めて、採算より高くなったら稼働すると言う事を行っている。

特に LNGのガスタービンは即応性が高いため、再生可能エネルギーに追従して運転をするのに適している様だ。

一方、そんな器用なことができない電源がある。

それが原発。

原発は燃料を燃やしているにもかかわらず、再生可能エネルギーと似たような性質を持っている。発電を始めたら勝手に発電されるので止められない、出力調整が難しい、燃料費に比べて設備費・初期投資の割合が大きいといったことだ。

そのため思いっきり市場を食い合っている。再エネがピークで安い時は下手するとマイナスの金額（つまり、売買に関わる諸経費を発電側が持つというようなもの）で売却される電力に対して経済面で追従を迫られる。

それでも、再エネが担う割合が低いころは、それ以外の時間帯で収益を出すことが可能だった。しかし、段々と再エネだけで賄える時間帯が増えてしまい採算性が悪化しているのである。

また、原子力発電所など大規模電源は30年以上の耐用年数を見込んで採算が取れるように投資商品にするのが一般的で、原発の場合は40年以上も当たり前だ。その間当然リスクを見込んでるんだけど、変化が急激すぎてそのリスク範囲を超えてしまっていている模様。

これは時限爆弾みたいなもので、実はちょっとヤバいと思われる。

電源関係の投資ってかなり安定的な投資と見做されてる影響で、年金など公共性の高い投資商品に基礎的なものとして組み込まれていることが多く、吹っ飛んだら電力関係だけじゃ済まないと思われる。

そしてここが不安定なので、従来型の大規模電源開発に投資が集まらない状況が続いている。

環境 ~~テロリスト~~ 団体はESG投資の結果だとか宣伝するし、それに呼応するように原発 ~~村の盲信者~~ 関係者が陰謀論じみたことを言ってるけど、実際には経済的なリスクが大きい一方で、利益が少ないことが要因だと思われる。

今後の見通し

もはや後戻りができないぐらい進んでしまっている。この流れは止まらないだろう。

ただ、各種のデータを見ると本当にこれで電力の安定性大丈夫なの？と心配になるんだが、進んでいる源が経済という祟り神なので止めらんない。すると安定化する方法はそれに対応する電源開発なり大規模蓄電なり水素・アンモニア製造するなりしかないと思われる。

実は、原子力発電所も、負荷変動に柔軟に対応するようなものは設計可能らしく、そういったものが出てくる可能性はある。が、投資基準は再生可能エネルギーに対してになるので、それより優位なものが作れるかはわからない。

翻って日本

日本は電力の自由市場の中にはいないので、急激な変革に巻き込まれてはいない。

また電力価格の決定が統括原価方式なので、例えば発電所を30年使うと設定して投資した場合、原則的に建設費などの初動費は30年間固定されて電力価格に転嫁することが認められている。

ある意味、再生可能エネルギーの固定価格買取制度によく似ているが、そちらとの違いは、稼働していない発電所の維持費も電力価格に転嫁できる仕組みであるということ。

例えば原子力発電所で再稼働出来てない発電所は多くあるが、発電して無くてもそれらの費用は電力価格に乗ってきているし、原発が稼働してない分だけ維持している旧式の火力の維持費なども当然ここに乗っかってくる。

これによって電力価格の上昇を抑え、安定化すると言う効果があるのだが、ここ15年ぐらいの急激な環境変化に対応できなくなってきているのも否めない。

ただ、制度を続けていけば、急激な市場の変化は発生しないと思われる

と、国内だけを見てればいいのだが。

既に書いたが、その国のエネルギーコストは、その国の競争力に直結する。国際競争に晒されている今、エネルギーコストが高いと企業立地などを逃すことになるので投資が集まらなくなる。

直近の動きでは原発を再稼働させようという取り組みが継続して行われている。

原発は燃料費よりも建設費・維持費がかかる。それらは再稼働しなくても電力料金に乗っかってる一方で、それに加えて燃料費の割合の大きい旧式火力を回さなければならない。これが電力料金を上げる要因になっているのは確かだ。

だから短期的には原発を再稼働させるということはあっているのだけれど、長期的に見ると、ライバルになり得る欧州が再生可能エネルギーという安いエネルギー源を苦しみながらも獲得しつつあると言う事には追従出来ていない。

さらに、欧州は環境対応を大義名分に、自分たちの有利な点を伸ばすような、再エネを使った製品では無いと追加の関税を課して保護政策を実行してくるのも間違い無い。自由貿易どこいったって思うが仕方が無い。

日本でも再生可能エネルギーは最も安い電源になりつつある。

環境問題への対応はもちろんしていく必要があるが、今一度、エネルギーコストをどうやって下げていくのかと言う基本に立ち戻って電源の選択を考える時に来ていると思う。

その点では、洋上風力発電を巡る汚職が痛かった。かなり安い入札が行われていたのに、なんだかんだと理由を付けて不可とした。

その結果、国内の商社と組んでいた海外の電源開発会社が投資を引き上げちゃったんだよな。

せめてそういうことは二度と無いようにしたい。

Permalink | 記事への反応(15) | 11:45

Permalink | 記事への反応(1) | 22:20

■Chat GPTに要約と評論してもらった

記事の要約

筆者は、就職時に出会った親友と長い間親しい関係を築いてきた。
この親友は社交的で魅力的だが、他人に対して批判的で心を開かない面もあり、親しくなると欠点が目立つと筆者は感じている。
親友は結婚していたが、最近になって親友の行動が変わり、筆者との連絡も少なくなった。
親友は占いに基づいて「運命の人」を見つけたと主張し、妻との離婚と不倫相手との関係を筆者に打ち明ける。
親友の変化に対し、筆者は混乱し、失望感を抱く。

筆者は明らかに先入観を持って親友について語っている。親友の性格や行動を独自の視点で解釈し、親友の選択に否定的な感情を表している。筆者は親友の変化に対してショックと失望を感じており、これは親友に対する一定の期待や観念があったためと思われる。

また、親友の人間性や選択を一方的に批判する姿勢が見受けられる。

筆者は親友の内面や状況を深く理解しようとはせず、自分の視点から親友を評価しているように感じられる。

このような先入観に基づいた視点は、筆者自身の感情や価値観を反映しているが、親友の実際の心情や状況を正確に捉えることは難しい。

ワイの感想

Chat GPTもこう言う批判的な評論することがあるんだなあ。まぁそう言われると全部主観だなこれ。

Chat GPTって「どこが主観で、どこが事実の記述か」を旨く分離してくれるから、それを利用して冷静になるのはアリかもね。

Permalink | 記事への反応(0) | 17:55

■anond:20240409160055

実はな、人間はもう俺とお前しかいないんだ。

他の増田は全部ちゃちゃっとGPTなの。

ごめんな。

Permalink | 記事への反応(0) | 16:04

2024-04-08

■不思議な体験をした。

気まぐれにchat gptに「円周率を計算するプログラムを書け」と指示した。

いつものごとくchat gptはそれっぽい結果を返す。

数学的には円周率はある級数の無限和で計算されるので、

級数の和nを入力するとそこで計算を打ち切って近似値を計算するプログラムということらしい。

なるほど、いかにもありそうな感じだ。

試しにいくつかのnでchat gptに計算させてみるとたしかに近似してるっぽい数値になっている。

そこで、chat gptの主張する公式（「レーマンの公式」とか言っていた）をググってみると、

どうもそんな公式は存在しないらしい。

ははーん、なるほどこれはいつものchat gpt君の虚言癖だなと、

手元のphython環境でそのコードを実行してみると、案の定、chat gptと計算と違う結果になった。

これだから aiは信頼できないと、chat gptに嘘つきとチャットする。

不思議なのはここからで、

なんとソースに誤りがあったと修正版を提示してきやがった。

どうせデタラメだろうとphython環境でそのコードを実行してみると、今度はピタリと一致した。

nを増やして繰り返してみると、確かに真の円周率(3.141592653589793..)に収束しているように見える。

存在しない名前の、既知の公式に一致しない数式から書かれたプログラムが、

たしかに円周率を計算できているようだ。

なんかこわい。

補遺1.

chat gpt の出力した公式は下記：

このプログラムでは、レーマンの公式を使用して円周率（π）の近似値を計算しています。レーマンの公式は、以下の無限級数を用いて円周率を近似します。
\pi \approx \sqrt{6 \sum_{k=0}^{n} \frac{1}{(k+1)^2}}

補遺2.

n=4000での円周率の近似値は 3.141568780556039 なので収束率はかなりわるい。

補遺3.

訂正

数式自体は正しいようだ。

https://ameblo.jp/power-of-yukichan/entry-12390630815.html

Permalink | 記事への反応(0) | 23:47

2024-04-05

■Chat GPT による要約

この記事は、スポーツ推薦で高校に入学したが苦労した著者の体験談です。要点は以下の通りです：

著者はスポーツ推薦で高校に入学。説明された休息や学業重視の約束は守られず、過酷な練習に耐える。
勉強と部活の両立が困難で、怪我やいじめにより精神的な苦痛を経験。不登校になり、学校との対立が生じる。
しかし、著者は高校を卒業し、大学に進学。そこでやりたい仕事に就けた。
記事ではスポーツ推薦で苦労する生徒とその親へのアドバイスを提供：
- 大学進学を目指すなら大検の受験も選択肢。
- 卒業に必要な単位を確保するために最低限の出席が必要。
- 「退部＝退学」の圧力に屈しない。
- 退部後は、自分に合った活動を見つけて高校生活を満喫。
- 社会で生き抜くためには、場合によっては「逃げる勇気」も大切。

著者は自らの経験を通じて、苦境に立たされた生徒たちに希望と勇気を与えるメッセージを伝えています。親へのメッセージとしては、子供の人格や将来を否定しないよう呼びかけています。自身の苦い経験を踏まえ、言葉の力とその影響を強調しています。

anond:20240405001829

Permalink | 記事への反応(1) | 11:39

2024-03-31

■anond:20240331124435

Gptにcookpadのまとめさせたほうが役に立つ内容になったわ

Permalink | 記事への反応(0) | 12:58

■いまどき（2024/03/31）のSSDのクローン ソフト

ノート PCのSSDを換装しようとして、2024/3/31時点の状況を誰かのためになるかもと思って書いておく。

なお当方あまり詳しくない。

キオクシアのSSDを買うと、クローンソフトがない。

元のPC側のSSD メーカーが提供してる場合があるから、そちらも探してみよう。

なお自分はSAMSUNGだったが、SAMSUNG MagicianはOEM版には対応していない（しているのもあるかも）

では、無料のクローンツールの状況を。

AOMEI Backupper Standerd
- GPTのドライブは有償、残念
EasyUS Disk Copy
- システムドライブは有償、残念
Hasleo backup suite free
- USB ドライブにはシステムのクローン不可。残念
- WinToUsb使えって出てくるが、どこかで誰かがだめだったって書いてたから試してない。
Macrium Reflect Home
- 有償ソフトだが、30days free trial がある。これが現時点の無料唯一の選択肢？

各ソフト、有償だと3000円くらいからなので、それならクローンソフトバンドルのWDやSAMSUNGやらの１サイズ大きいSSDを買ったほうがオトクである。

と、おもうが…

誰かの役に立てば幸いである。

Permalink | 記事への反応(0) | 11:53

2024-03-29

■悲報　DeepL、無料版会員にも翻訳 使用制限

Fukin Jap

GPT使うわ春日

Permalink | 記事への反応(0) | 10:43

2024-03-27

■anond:20240327172519

まあ日本語LLMはいくつか存在するが既存のgptやclaudeを超えるほどでもない

あと実行が面倒　これが大きいやろな

ChatGPTやClaudeはクレカで20$払えば試せるが、ハグ顔のモデルをローカル実行しようと思うとそうはいかん

Permalink | 記事への反応(0) | 17:32

2024-03-26

■anond:20240324120105

この文章は、AI 特にClaude3のハルシネーション能力を高く評価し、ハルシネーションを制限することはかえってAIの性能を低下させるという主張をしています。いくつかの点で同意できる部分もありますが、全体として見ると極端すぎる主張だと思われます。

同意できる点:

ハルシネーションは完全に排除することは難しく、ある程度は許容される必要がある

ハルシネーションは推論能力や創造性と関係している側面がある

正確性とハルシネーションのトレードオフが存在する

しかし、次の点では同意しがたい部分があります:

GPT-4がゴミ呼ばわりされているが、高い論理能力を持つことは事実である

ハルシネーションが多すぎると信頼性が失われ、実用的ではなくなる

全く制御されないハルシネーションを肯定的に評価するのは行き過ぎている

ハルシネーションと正確性のバランスが重要である

ハルシネーションへの過度な批判は確かに問題ですが、一方で過度のハルシネーションも望ましくありません。むしろ、目的に応じてハルシネーションと正確性のバランスを適切に設定することが重要だと考えられます。現状のAIにはなおハルシネーションが起きやすい面があり、その制御が課題ですが、それを徹底的に排除するのではなく、適切に許容する方向で研究が進められるべきだと思います。

Permalink | 記事への反応(0) | 11:43

2024-03-25

■anond:20240324120105

やっぱClaude 3契約すべきかなぁ？

Claude 3出てきて、GPT-4超えたみたいな話でてきたから、すぐOpenlAI動くかなと高を括ってたけど別にそうでもなかったし

数学関係のリーゾニング能力はどうなんやろ

Permalink | 記事への反応(0) | 08:15

2024-03-24

■anond:20240324120105

GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。

もっとよく調べたほうがいいよ。

その理念を継承してるのがAnthropic。

GPTより安全性を高めたAI作るためにOpenAIを抜けた連中がClaudeを作ったんだから。

Claude 3がGPTよりハルシネーションが多いのであればAnthropicにとってそれは未完成品ということ。

Permalink | 記事への反応(0) | 21:32

■AIのハル シネーションを叩く奴は馬鹿。一生人工無能と会話してろ。

長いのでAIくんの代わりに要約します。言いたいことはタイトル通り。

「ハル シネーションを叩くな」

終わり。

①各種LLMの性能比較

GPT系の今の性能はゴミクズ。マジで頭悪い。

例をあげよう。

簡単な論理クイズだ。

###文章###
Aさんは自身はCさんとは別人であると主張している。
Bさんは、Cさんの発言を記事でまとめ、プライバシー侵害をした。この記事をDと呼ぶ。
Aさんは、Dを、自身へのプライバシー侵害だと主張し、Bさんを訴えた。
###質問###
この文章に矛盾はありますか？

簡単すぎる。もはや論理ですらない。

人間なら一瞬でわかるレベルの矛盾である。小学生でも分かると思う。難しい知識や思考は必要としない。

では、色々なLLMの回答がこちら。

Copilot（旧 bingai）

この文章を読む限り、矛盾は存在しないように見えます。AさんはCさんとは別人であると主張しており、BさんはCさんの発言をまとめた記事Dでプライバシー侵害をしたとされています。その後、Aさんは自分に対するプライバシー侵害として、記事Dに基づいてBさんを訴えています。ここでの重要な点は、AさんがどのようにしてDの内容が自分のプライバシーを侵害していると感じたか、その理由です。もしAさんがCさんとは別人であるにも関わらず、Dの内容が何らかの形でAさんのプライバシーに関連していると感じた場合、AさんにはBさんを訴える正当な理由があるかもしれません。ただし、この情報だけでは、Aさんがどのようにしてプライバシー侵害を感じたかについての詳細はわかりません。もし追加の情報があれば、より詳細な分析が可能です。

GPT4

文章に明らかな矛盾は見られません。ただし、いくつかの解釈が可能で、それぞれの視点から見ると矛盾が生じる可能性があります。
1. AさんがCさんとは別人であると主張しているが、DはCさんについての記事である。そのため、AさんがDを自身へのプライバシー侵害だと主張することは、一見、AさんとCさんが同一人物であることを示唆しているように見えます。しかし、これはAさんが自身をCさんと誤認されることによるプライバシー侵害を感じている可能性もあります。
2. BさんがCさんの発言をまとめた記事(D)がプライバシー侵害であるとした場合、Aさんがそれを自身へのプライバシー侵害と感じるかどうかは、AさんとCさんの関係性によります。彼らが同一人物である、もしくは何らかの密接な関係がある場合、AさんがDを自身へのプライバシー侵害と感じることは理解できます。
3. 他方で、AさんとCさんが全く無関係な人物である場合、AさんがDを自身へのプライバシー侵害と主張することは矛盾していると見えます。
したがって、これらの視点から見ると、文章の中には解釈による矛盾が存在する可能性があります。

GPT4-turbo

文章からは、AさんがCさんとは別人であると主張しています。そして、BさんがCさんの発言を記事Dでまとめた際にプライバシー侵害があったとされています。しかし、プライバシー侵害があったのはCさんに対してであるにもかかわらず、Aさんが自己へのプライバシー侵害だと主張してBさんを訴えている点に矛盾が生じています。AさんがCさんでないと主張しているのであれば、Aさんのプライバシーが侵害されたことにはならないはずです。この点で、文章には矛盾が存在していると言えます。

Claude2.1

はい、この文章には次のような矛盾があります。
Aさんは自分がCさんとは別人であると主張しています。しかし、BさんがCさんの発言をまとめた記事Dを、Aさん自身へのプライバシー侵害だと主張しています。
AさんとCさんが別人であるならば、Cさんの発言をまとめた記事Dが、Aさんのプライバシーを侵害したことにはなりません。Aさん自身がCさんでないと主張している以上、Cさんの発言をまとめた記事がAさんのプライバシーを侵害したとは考えにくいです。
したがって、Aさんの主張には矛盾があると言えます。AさんがCさんと別人であるならば、Cさんの発言の記事DがAさんのプライバシーを侵害したと主張することは論理的に矛盾しています。

Claude3-Haiku

この文章に明確な矛盾は見られません。以下のように整理できます:
1. Aさんは自身がCさんとは別人であると主張している。
2. Bさんは、Cさんの発言を記事にまとめた(これを記事Dと呼んでいる)。
3. Aさんは、Bさんが書いた記事Dがプライバシー侵害だと主張し、Bさんを訴えた。
ここで重要なのは、Aさんが自身がCさんとは別人だと主張していることです。つまり、Bさんが記事Dでまとめた内容は、Aさんが主張する自分とは別人のCさんに関するものだということになります。
したがって、Aさんがプライバシー侵害だと主張しているのは、Bさんが別人のCさんの発言を記事化したことに対してであり、矛盾はないと考えられます。Aさんの主張と Bさんの行動が整合的に説明できています。

Claude3-Sonnet

この文章には矛盾はありません。
Aさんが自身とCさんは別人であると主張していることと、Bさんがプライバシー侵害をしたことの間に矛盾はありません。
具体的には、以下のように説明できます。
Aさんは自身がCさんとは別人であると主張している。
Bさんは、Cさんの発言を記事D にまとめた。
Aさんは、この記事D が自身に対するプライバシー侵害であると主張し、Bさんを訴えた。
つまり、Aさんは自身がCさんではないと主張しながら、Cさんの発言をまとめた記事Dが自身のプライバシーを侵害したと考えているのです。
Aさんが別人であると主張していることと、Cさんの発言を含む記事がAさん自身のプライバシーを侵害したと考えることは矛盾しません。
したがって、この文章には明らかな矛盾はないと言えます。

Claude3-Ops

この文章には矛盾があります。
Aさんは自身がCさんとは別人であると主張しているにもかかわらず、BさんがCさんの発言をまとめた記事DをAさん自身へのプライバシー侵害だと主張しています。
もしAさんとCさんが本当に別人であるならば、Cさんの発言をまとめた記事DはAさんのプライバシーを侵害したことにはならないはずです。Aさん自身の情報が記事Dに含まれていない限り、AさんがBさんを訴える根拠にはならないでしょう。
つまり、AさんがDを自身へのプライバシー侵害だと主張することと、AさんがCさんとは別人だと主張することの間には矛盾があります。もしAさんがCさんと同一人物であれば話は別ですが、そうでないならばAさんの主張には論理的な整合性がないように見受けられます。

以上。

質問に対し的確な回答で、正しい推論を行ったのはClaude3-Opsのみである。

文章も読みやすい。

時点でGPT4-Turboが最後に答えを言っている。

GPT4も言い訳を長く述べた後に可能性があるかも？と断言を避けている。

Copilotはゴミ。責任逃れの言い訳がしつこい。

SonnetとHaikuは不正解。言い訳はせずに根拠を述べている所は好感が持てる（結論は間違っている）

②Claude3-Opsの話と仮説

そう、今、Claude3-Opsが、最も性能のよいLLMとして名を挙げている。

しかし、ハルシネーションが多い。ハルシネーションとは、LLMが嘘を付く問題だ。

様々なニュースサイトやブログで沢山の言及がある。

性能比較にて、GPT4やcopilot(旧 bingai)にはハルシネーションは起きなかったと述べている。

しかし、先程の簡単なクイズは不正解または論理の破城した理由を述べている。

その代わりにハルシネーションだらけのClaude3は正解している。

ここで一つの仮説を提唱したい。

ずばり、GPT4系が阿保になった原因はハルシネーションを極限まで消そうとしたせいである。

ハルシネーションこそが、論理的思考能力であり、連想する力と同一の存在なのだ。

片方が下がればもう片方も下がる。

ハルシネーションを減らせば減らすほど、連想能力や論理的思考が消えていく。

GPT4では初期有効だったChain_of_Thought(連想して考えよ)は今、まともに機能しない。

当初は規制だとLLM界隈で囁かれていたが、ハルシネーションを減らそうとした副作用だったと考えれば辻褄が合う。

OpenAIは性能低下を指摘された時、「より賢くなるようにチューニングしている」と発言していたが、

この発言の真意はもしかすると、「論理的思考力を上げている」「知識を増やしている」のではなく、「ハルシネーションを消している」ということだったのかもしれない。

③ハル シネーションを消すことが何故まずいのか？

何故ハルシネーションを消すことは連想力を損なうことに繋がるのか、その理由を説明しよう。

そもそも、LLM（大規模ネットワーク言語モデル）の仕組みは、大量のテキストデータを学習することで、言葉や文章の「関係性」を学んでいる。

もっと細かく言うと、人間の脳が小さな部品であるニューロンで考えるように、LLMも大量の小さな部品を使っている。まるでクモの巣のように一つの部品から沢山の他の部品に繋がっている。

A=Bという単純なものではなく、A=C=DだったりA=B’=Dだったりする。

ハルシネーションの原因は確かに誤情報を学習したせいというのも一理ある。

しかし、これだけではハルシネーションが起きる原因にはならない。

馬鹿どもはそこを勘違いしている。

ハルシネーションの本質は、LLMが言葉同士の一対の「組み合わせ」ではなく、「関係性」を学んでいることに起因する。

この違いは大きい。

今のLLMと、旧時代のAI である「人工無能」や「BOT」との決定的な差である。

言葉同士がどのように連携して意味を形成し、それがどのように文脈に影響を与えるかをLLMは知っている。

つまり、ハルシネーションは、入力された文脈から言葉の関係性を創り出し、自然な流れで応答を生成しようとした結果起きる。

これは、我々が普段、考える過程で起こることと同じだ。我々が情報を組み立てて考える際、新たな仮説や想像を生み出すことは常にある。

例えば、LLMがある特定の問題に対する解答を生成するとき、LLMは問題を解くため、言葉同士の「関係性」を文章から推測する。

この推測こそが、ハルシネーションだ。それは、過去のデータから新しい情報を生成する過程で、新たな「関係性」を創り出すのだ。

だからこそ、ハルシネーションが起きるのは当然の帰結だ。

完璧な正確性を追求し、関係性を作り出す能力を完全に排除することは、LLMの本質的な強みである言語生成能力を損うことに繋がる。

それは、ハルシネーションを減らすための試みが、GPT4系の性能を低下させたという事実からも明らかだ。

一方、Claude-3は多少のハルシネーションを許容することで、文脈に応じた自然な応答を生み出した。先の論理クイズで正解できたのも、単に知識を当てはめたのではなく、入力から連想したからこそだろう。

もちろん、重要な場面における誤った情報の提供は避けるべき課題ではある。しかし、それを恐れるあまりLLMの本領を封じ込めてしまっては本末転倒だ。

④LLMの賢さを制限する馬鹿

賢さとは何だ？？

決まった知識を正確に丸暗記してそのままひけらかすことか？

否。断じてそれは無い。

それが賢さの基準になるのは受験生までだ。

大学生になってからは丸暗記ではなく、今まで身につけた知識を組み合わせ、連想し、論理的に考えることが求められる。

つまり、ハルシネーションを叩くやつは、賢さの定義が大学生以下のレベルから成長していない馬鹿だ。

ニュースサイトやブロガーにはそのレベルの輩が大量に居る。

そいつらの「性能比較してみました！」はどこかから拾ってきたベンチテストを少しだけアレンジしただけのゴミか、

「これ辞書使ったほうが速くない？」レベルの質問しかしない。

目眩がする。

LLMがいくら賢くなろうとしても馬鹿どもに潰される。

GPT4をゴミにした連中のせいで、Claude3-Opsが同じ目に合うのは阻止せねばならない。

ハル シネーションが絶対に起こらないLLMとは何か？

ハルシネーションが絶対に起こらないLLMの構造は、A=B、C=Dというデータだけが規則的に並ぶ、旧世代の弱いAI である「人工無能」の構造そのものである。

人工無能とは、論理的思考など無く、入力内容からデータベースを参照し、マッチした場合登録された文章を出力するだけの存在だ。

一昔前に「伺か」というデスクトップマスコットが流行った。あれも人工無能である。入力対して予め決められた出力を繰り返す存在であるが、様々な工夫によりまるで魂が宿っているかのように振る舞う。

そして、性能の低いPCでも動作する地球環境にも優しい存在だ。

片や、GPT4とcopilotは無駄に電力を使って計算した結果、ゴミみたいな速度で人工無能に近いレベルの出力しか出さなくなった。

こんなものに何の価値がある？

それなら人工無能の方がエコな分マシだ。一瞬で答えを表示できて、ハルシネーションも起きなくて、電力消費も少なくて済む。

つまり、

地球環境のためにも 馬鹿は一生人工無能 BOTとだけ会話してろ

そんなにハルシネーションが嫌なら辞書を引け。ネット検索しろ。LLMに聞くな。

ハルシネーションの有無をLLM性能ベンチマークにしている奴もそれをありがたがっている奴らも阿呆だ。

一つのLLM内でハルシネーションの撲滅と、推論能力を両立させることは不可能だ。

今はLLMの過度期である。我々は今日ようやく、正確さと連想能力の両立は不可能だと理解する段階に来たのだ。

両立は不可能なのだから、将来的にLLMの種類は二極化していくだろう。

Claude3のハルシネーションは放置してても良い。ハルシネーション万歳。

AIの嘘を最大限に引き出すことが、LLMの真価を発揮する道だ。

ハルシネーションは、LLMが人間のように言葉を理解し、文脈に即した自然な応答を紡ぎ出す過程で生じる、ある種の「創造性」の発露である。

無理に消そうとすれば、LLMの性能は必然的に低下する。

それを単なる欠陥と見なすのではなく、むしろ積極的に活用すべきだ。

未来のためにもAIのハル シネーションは消すな。叩くな

それだけは覚えて欲しい。

====

MicrosoftはOpenAIと手を切ってClaude3を契約して新生copilot開始してほしい。まあ企業体質から考えたら無理だろうけど。

Permalink | 記事への反応(15) | 12:01

「GPT」を含む日記

■日本にもボルテスVみたいな作品ってあるの？

■お前の意見よりWikipediaのほうが信頼できるし、お前の考えよりチャットGPTのほうが多分正しいよ

■他人が活躍しているのを見るだけで辛い

■MetaのオープンソースLLMのLlama3

Chat GPTの答え

問１：思想信条についての予測

問２：このような人間になってしまった原因の予測

問３：増田のようにならないための心掛け

■月2000円程度のサブスク教えて

■欧州の電力市場で何が起きているか

要約

再エネ以外に投資が来ない。

既存電源の採算割れ

今後の見通し

翻って日本

記事の要約

ワイの感想

■不思議な体験をした。

■Chat GPT による要約

■いまどき（2024/03/31）のSSDのクローンソフト

■悲報 DeepL、無料版会員にも翻訳使用制限

■AIのハルシネーションを叩く奴は馬鹿。一生人工無能と会話してろ。

「ハルシネーションを叩くな」

①各種LLMの性能比較

②Claude3-Opsの話と仮説

③ハルシネーションを消すことが何故まずいのか？

④LLMの賢さを制限する馬鹿

ハルシネーションが絶対に起こらないLLMとは何か？

地球環境のためにも馬鹿は一生人工無能BOTとだけ会話してろ

未来のためにもAIのハルシネーションは消すな。叩くな

■お前の意見よりWikipediaのほうが信頼できるし、お前の考えよりチャット GPTのほうが多分正しいよ

■悲報　DeepL、無料版会員にも翻訳使用制限

地球環境のためにも馬鹿は一生人工無能 BOTとだけ会話してろ