はてなキーワード: ArXivとは
そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。
わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。
今期最も人気のアニメはなんですか?
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?
アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。
一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの7話泣かされたわ・・・」みたいな投稿のことであってイラストではない。
Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である
現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?
このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。
A. LAIONは非営利の研究組織です。ドイツの著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています。
とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。
尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。
他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。
もう、全てが間違っている
そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである(poisoned って書いてあるでしょう?!)
相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)
それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。
事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。
反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。
Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。
図:毒入りモデルの変化 (arXiv:2310.13828から引用)
上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。
図:毒入り枚数による変化 (同引用)
こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。
もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。
ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?
Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。
Glaze が機能しない?あるいは解毒方法が見つかったかもしれない
上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。
A) 絵師さんが Glaze をかけたあと画像を縮小した可能性
B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする
C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)
A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)
LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。
ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト/ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフの Simple Attak に相当)
90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね
この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。
SNSってほんとクソだよなぁって思うんだよね。ゴミ情報の下水道でしかねぇ。
対面で会ったこともねぇ連中の私生活の開陳を見せられて何が面白いんだ?
お前がいくらネット上で俺と親しいようなフリをしようと、すげぇ浅ぇの。
画像とか動画のようなコンテンツだとしても、イラッとするようなのが多いんだよな。
誰かを非難するためだけに書かれた漫画とか、選挙動画とか、俺は興味ねぇの。
猫とかミームとか見てるとキレそうになるんだよね。
なんでこのゴミを俺に見せるんだろうなって。
numpyのアップデートを追う?githubをRSSフィードで追うとか、そういうのでいいわけで、Xのnumpyアカウントをフォローする必要はねぇよな?
最新の数学研究について知りたい?arxivをRSS購読すればいいよな?
なんで発信してるの?そんなゴミ情報を。男女論?弱者男性論?フェミニスト?ウゼェだけだろ。
Xの最もクソな点は、おすすめ、トレンド、リツイート。俺の興味のないことを表示するからイライラが勝る。
ぐらいのもんだな。
無名状態ではarxivのendorsementを得ることが出来ない。AIが提案したパスとしては、以下のいずれかがある。
結局自分の肌がどれくらい健康なのか、何が足りなくてなにが過剰なのかを知ることが慣用で、問題がある場合にはそれが緩和されるような成分を選ぶ、というのが成分との付き合い方かと思う。
成分を気にしないといけない、気にしたほうがいいのは、その製品の効能の主となる成分、製品のメインコンセプトに係る部分であり、おまけ程度に「XX配合!」とか謳ってるのは正直賑やかしにすぎないことが多い。
完全に同意。肌状態を正しく把握して理想的な状態に至るために何が必要かを知ることを抜きにしたスキンケアは、病気じゃないのに薬飲むのに等しい。そしてこの部分って正にスキンケアの話題において語られない部分であるように思う。
例えば医療であれば、素人が自分の状態を知ろうとする場合、医療機関での診察や検査を受けることで定量的なデータやそれに基づく専門的見解を得ることができる。自分は美容クリニックもそれなりに利用しているが、そういう抜本的な検査というのは一度も受けたことも提案されたこともない。無論、弊増田が単に無知なだけでそういう対応を受けられる機関はごまんと存在しているのかもしれないが。よく肌タイプが云々みたいな話を見かけるが、あれは何の根拠があって言っているのか、それ16personalitiesより信憑性あるのかな?と常々考えている。
俺は、俺たち彷徨える「清潔になりたい男」たちは、一体どうやって正しく自分の現在地点を知ればいいんだ。誰にそれを尋ねればいい? それが分からないからこそ、とりあえず細胞間脂質層の50%を占めるセラミドを塗布すればいいんだなと早合点してしまう俺のような哀れな羊が今も、ここが何処なのか、これから何処へ向かえばいいのか、何も分からないまま彷徨っているんだ。
ビタミンCとかビタミンA(レチノール)に関しては外用でのデータも多いけど、安定した形で化粧品に配合するのが難しかったりで、成分として配合されているといって効果が期待できないこともある。
通ってたクリニックの医師からビタミンCはイオン導入でないと殆ど浸透しないと教わっていたんだが、同時にそのクリニックでビタミンC配合の化粧品を販売していてどっちなんだよと思ったことを思い出した。ビタミンの外用に関するデータ自体は結構あるんだな。PubMedもarxivみたいに手軽に全文読めれば追従しやすいんだが・・・・・・
まず、Twitterでも論文の最新情報を追うようなことは可能
"AI papers"のようなArxiv論文専門のアカウントがある
またAI papersがフォローする専門家のアカウントをフォローすれば、最新論文の共有情報が見れる
ではTwitterの何がいけないかというと、一つはおすすめアルゴリズムがクソっていう点
学術情報が知りたいと思っていても、政治対立や男女対立の情報をおすすめしてきたりするのでノイズになる
あとは英語圏のツイートに対して引用リツイートやリプライしても反応が薄いこと
これは諜報機関が国家の境界にボーダーを敷いており、干渉を防いでいるためと言われている
要は「英語に目を向ければ最新の研究情報(特に論文)を知ることはできるけど、ノイズが多いし、自分からの発信の価値はない」という話
グリゴリー・ペレルマンは昔から政治が嫌いだったらしい。
友人と会話して政治的なことが出ると「◯◯君、それは政治だよ」とピシャリと指摘したと聞く。
ミレニアム懸賞問題の論文を提出し、それが評価される過程での政治が発生したときは「俺は政治家じゃねぇ!」とキレたようだ。
賞金も辞退し、数学会から手を引いてからは、オペラの鑑賞を趣味として質素な生活をしているらしい。
誰も解けない問題を解き、arxivに成果を出すことで出版社に存在する政治を避け、数学的証明の正しさだけで勝利を勝ち取った男がペレルマンその人である。
このストーリーを聞いて私は、この人こそ尊敬に値する数学者だと思った。
研究助成金をもらうための政治的活動に熱を入れる数々の自称研究者とは格が違う。
数年前はgithubでOSSを公開することがそういう趣味だと思い込んでいたが、スター数で評価されるという政治が存在することに気が付き、消極的になった。
社会でなにか評価されようとすることが政治なのだろう。ポアンカレ予想ですら中華が業績を奪おうと政治工作したのだから。
私はプログラミングを趣味と仕事の両方でやっているが、コンピュータはインターネットを通じて社会と繋がりすぎている。
神はサイコロを振るだけでなく、想像をはるかに超える数の部屋があるかもしれない。実際、無限にある。
約1世紀にわたり、量子力学の旗の下にある理論と観測によって、現実の理解は複雑になってきた。
物体が速度や位置といった絶対的な尺度を持っていた時代は終わった。
これは直感的な宇宙観とは程遠い。コペンハーゲン解釈として知られるようになったものでは、可能性の波があるように見えるがそうではない。
現在でも何が最終的にシュレーディンガーの猫の運命を決めるのかはまったく明らかではない。
ヒュー・エヴェレットは1950年代に、可能性のあるすべての手段がそれ自身の現実を構成していることを示唆した。
この現象を特別なものにしているのは、たまたまあなたがそれを観察しているという事実にすぎない。
エヴェレットの「多世界」モデルは、量子力学の絶対的な奇妙さを具体的なものに置き換える方法である。
可能性のある無限の多元宇宙、あるいはグローバル・ハミルトニアンとして知られるすべてのエネルギーと位置の総和のようなものから出発し、興味のあるものにズームインして、有限ではるかに管理しやすいハミルトニアンのサブシステムの中で無限を制約する。
しかし無限を理解する手段として、この「ズームイン」は足を引っ張ることになりはしないだろうか?
別の言い方をすれば、シュレーディンガーの猫が箱の中で生きているのか死んでいるのかを容易に尋ねるかもしれないが、その下のテーブルが温かいのか冷たいのか、箱が臭くなり始めているのかどうかは考えない。
研究者たちは、箱の中身に注目し続ける傾向が重要かどうかを判断するために、ポインター状態として知られる量子の可能性が、他の状態よりも少し頑固に設定され、いくつかの重要な性質がエンタングルするかどうかを検討するアルゴリズムを開発した。
もしそうならシュレーディンガーの猫を説明する箱は、宇宙のはるか彼方に広がる可能性のある長い要因のリストを考慮しない限り、ある程度不完全である。
エヴェレットの多世界から出発して、研究チームは多世界解釈と呼ぶものを考え出した。無限の可能性のセットを取り出して、我々が通常考えないような現実の無限の範囲を掛け合わせるのだ。
オリジナルの解釈と同様、この斬新な解釈は、宇宙の振る舞いについてというよりは、宇宙を一口ずつ研究しようとする我々の試みについてのものである。
研究者たちは、このアルゴリズムに概念的な重要性はあまりないと強調しているが、コンピューター内部のような量子システムをプローブする優れた方法を開発する上で応用できるのではないかと考えている。
他の現実に、すでにその答えがあることは間違いない。
こんにちは、皆さん。今日は少し物議を醸すかもしれないトピックについて語りたいと思います。
それは、「ソフトウェア技術の99.9%はインターネットから学べるのでググる力を身に着けましょう」という考え方です。
現代のソフトウェア開発者にとって、インターネットは最も重要な学習リソースの一つです。
オンライン上には無数のチュートリアル、ドキュメンテーション、フォーラム、ブログ記事、論文があり、それらは私たちが新しい技術を学び、問題を解決するのに役立ちます。
しかもこれらはソフトウェエア技術のほぼ全分野をほぼ網羅しており、見つからない情報はありません。MIT OCW, arxiv, github, kaggleなどなんでもあります。
「ググる力」とは、情報を効率的に検索し、適切な情報を見つけ出す能力のことを指します。
これは、適切なキーワードを使用したり、信頼性のある情報源を識別したり、関連性のある情報を抽出したりする能力を含みます。
ソフトウェア開発は常に進化しています。新しい技術やフレームワークが日々生まれ、既存のものも更新され続けています。
このような環境では、すべてを覚えることは不可能ですが、必要な情報を素早く見つけ出す能力があれば、それが可能になります。
私の主張は、すべてのソフトウェア開発者が自分自身で学ぶこと、そしてそのための最良のツールがインターネットであるということです。
そして、そのためには「ググる力」を身につけることが不可欠です。
それはお前がarxivを調べるという発想にすらたどり着かなかったからだよ
https://arxiv.org/search/hep-th?searchtype=author&query=Kaku,+M
究極理論がわからない現状、もし仮に「我々の世界が不安定な真空にいる」ことを仮定すれば
相応のエネルギーを加えて真の真空に落とす(相転移させる)ことで物理法則が変更されるという
人為的ネオエクスデス「うちゅうの ほうそくが みだれる!」 ができますね。
イメージ的には過冷却です。すでに相転移が起きているのに気がつかないで元の真空にとどまっています。ちょっと突くと一瞬で凍ります。
現に、新しい加速器が作られる度になんかスゲェ無理矢理な模型を作って「加速器のせいで世界が滅びる!」系の論文がarXivに投稿されたりします。意外と増田と同じことを考える人がいるんですね。ただしこれらの論文は一瞬で否定されます。なぜならば、加速器で作るビームなんかよりも中性子星ガンマ線バーストのほうがよほど強いからです。宇宙強い。人類の技術は弱い。驕るなよ人類。
前から不思議だったけど、これらの法則って経験から導き出されたものであって、その法則がどうやって存在してるかは不明なんだよな
以下、意味は取らなくて良いので流れと単語だけ拾ってください:
たとえばエネルギーの保存は時間方向の並進対称性、運動量保存則は空間方向の並進対称性から、角運動保存則は回転対称性から導き出されるといえるでしょう。
(相対論的には時間と空間は同時に取り扱うのですがちょっと難しくなるので簡易な書き方をしています)
時空の対称性が決まる → ラグランジアンが決まる → オイラーラグランジュの方程式(運動方程式)
ここまでよんだ?
なら次は、ランダウ・リフシッツ「力学」の最初の20ページくらい読んでください。
前提知識は微積分です。ここまで読めば上の文章はだいたい理解できるかと思います。
そして次にあなたはこう思うでしょう
「最小作用の原理っていったいなんなんだ? 世界はなぜこんな原理に従う?」
そう思ったなら次は量子力学です。JJサクライ「現代の量子力学」の経路積分のページまで読み進めましょう。
ここまでくれば霧が晴れるように見通せるようになるはずです。
物理理論とは何であるかが把握できるかと思います。ここから先はご自由に。
なお、JJサクライは物理科ではちょっと ’進んだ’ 内容とされています。普通は2冊目に読む本ですね。が、ハテナーにとってはむしろ読みやすい本かと思います。だってどうせ君ら情報系でしょ?なんかプログラムとか書ける人たちでしょ??なら、ブラケット表記の方が慣れていると思うんですよ。たぶん見ればわかるよ。
ネットがつまらない理由は個人の主観の問題ではなく、実際につまらなくなってるから
面白い人はリア充化してるし、つまらない人がネットに入り浸って釣りだの煽りだのやってる
反応を最大化しようとして極端なことや言葉遣いを使う連中だらけ
ネットの中に面白いコンテンツがあるとすると、それは10年以上前に書かれた文章だったりすることが多く、それはアフィカスやバズり目的に支配される前だったと言える
あるいはarxivのような論文サイトであれば少しは楽しめるが、コミュニティサイトという感じはない
コミュニティサイトで唯一関心があるのはstack exchangeだ。X、reddit、Quora等、人格破綻者のパヨクが多い。
はっきり言おう。ネットがつまらないのはパヨクやリベラルのせいだ。ハフポスト見てるか?お前らパヨクがネットを破壊してるんだよ。
ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからのホットエントリ、ブクマ数順トップ30
ブクマ数 | タイトル | ドメイン |
---|---|---|
1359 | 国土交通省 ネガティブ情報等検索サイト | www.mlit.go.jp |
1087 | ゲームを趣味にしている人の割合が多いのはどのくらいの収入の人たちなのか調べてみた - nonameのノート | noname774300.hatenablog.com |
854 | マシュマロ!|高河ゆん|pixivFANBOX | kouga-yun.fanbox.cc |
850 | トコジラミ根絶方法 | 害虫・害鳥獣を安全に対策します|株式会社 オオヨドコーポレーション Pテックス社 | oyodo-pmp.com |
847 | ラマヌジャンは本当に何も知らなかったのか | mathlog.info |
774 | 裏紅白歌合戦2023 | jiyujoho.a.la9.jp |
679 | 水は変わった物質 | vitroid.github.io |
671 | しずかなインターネット | sizu.me |
606 | 日米でエンジニアの育成戦略が正反対だと気付いた話 - メソッド屋のブログ | simplearchitect.hatenablog.com |
498 | 『ゼルダの伝説 ブレスオブザワイルド』が品質を高めてくれた。売上10万本超え、R18インディーゲーム『洗脳アプリで高慢なお嬢様を好き放題するシミュレーション』開発者インタビュー - AZ-LINE あずらいん! | az-line.jp |
484 | ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログ | tech.connehito.com |
475 | 超映画批評『ゴジラ-1.0』90点(100点満点中) | movie.maeda-y.com |
465 | メールアドレスをキーにしてID連携を行う設計の危うさ|ritou | sizu.me |
454 | 「直接会って話したほうがはやい」は速いだけ|araya | sizu.me |
438 | ベンダが提供していない決済モジュールの不具合による情報漏洩事故 東京地判令2.10.13(平28ワ10775) - IT・システム判例メモ | itlaw.hatenablog.com |
436 | Othello is Solved | arxiv.org |
435 | 池田大作氏の御逝去の報に接し | kishida.gr.jp |
424 | https://ip.guide/ | ip.guide |
421 | ナポリタンが究極の味になる!ほんのひと手間に「やって大正解」「今度からこうする」 - macaroni | macaro-ni.jp |
421 | 大麻、少年の性被害、男らしさの病(松本俊彦)[第12回] 酒をやめられない文学研究者とタバコがやめられない精神科医の往復書簡 | ohtabookstand.com |
407 | 変なドメイン取るな.net | www.henna-domain-toruna.net |
401 | mRNAのひみつ | まんがひみつ文庫 | まんがでよくわかるシリーズ | 学研キッズネット | kids.gakken.co.jp |
377 | 【雑記】セキュリティガイドライン類 約300時間 読み漁ってみた - 2LoD.sec | nikinusu.hatenablog.com |
374 | 弊社元幹部社員の不正について/日本海テレビ | www.nkt-tv.co.jp |
368 | t_wadaさんと「単体テストの使い方/考え方」の疑問点についてディスカッションしました - DeNA Testing Blog | swet.dena.com |
361 | コラム・寄稿「なぜドイツ人にできることが日本人にできないのか」 | www.rieti.go.jp |
360 | 令和時代の個人サイトの作り方:suama works | techbookfest.org |
356 | 【楽天市場】SPUの特典内容変更について|SPU(スーパーポイントアッププログラム) | event.rakuten.co.jp |
345 | 国産プレミアムウイスキー 一部商品の価格改定について | www.suntory.co.jp |
335 | Mini vMac | lrusso.github.io |
インターネットがつまらなくなった、と言う人がちらほらいることに気がついている人もいるかもしれない。皮肉を言いたがる鬱陶しい人は、すぐに「それはお前がつまらなくなったからだ」と言うが、それは物事のほんの一つの側面でしかない。
長文を読むことが苦手な人のために、結論から述べようと思う。インターネットがつまらないのは、人々がタイパと刺激を求めた結果である。限りある人生を有効に使いたい。ここまではよかったはずだ。だが世の中を見渡せば、「簡単に理解できるコンテンツ」「刺激的なコンテンツ」「感情を煽るコンテンツ」で溢れている。マスターベーションを覚えた猿が繰り返すように、インターネットから刺激性を学習した猿は狂ったようにスクロールする。
私がソフトウェアのブログを書いていた時、あることに気がついた。難解でユニークなアルゴリズムを公開するよりも、「○○のインストール方法」といった初心者的コンテンツのほうがアクセスが多いのである。何かをインストールする方法など、ドキュメントを見れば一発でわかるのに、ブログにアクセスしてくる。いや、検索エンジンがドキュメントではなく私のブログをTopに誘導するのがそもそもおかしいだろう。悲しいことに、ドキュメントをちゃんと読める人が少数派であり、平易な言葉で書かれたブログの方を好む人が多いということだ。
個人的価値観を述べれば、インターネットに私が求めるのは「深遠」である。ゲーム理論と確率微分方程式を組み合わせたらどうなるのかとか、プラグマティズムをソフトウェア工学に適用するAndy Huntの最新の哲学的考察を知りたいとか、そういうことだ。
深淵の理解には時間がかかる。タイパと刺激の発想とは逆だ。一見退屈に見える無刺激な長文を、ゆっくりと地道に隅々まで理解しなければならない。深淵は真面目でストイックで、人生を共に歩むように接する。コンテンツを書いた人間を個人として尊重し、友達と語り合うような気分で読み解くのである。
「コンテンツは見て射精して賢者タイム。それで終わり」というのが現代人がやっていることだ。インターネットは元々学術的な(つまり深淵的な)情報交換のために作られたが、今では娯楽(つまりオナニー)が大半を占めている。そういう消費者に合わせて作られたものは、簡単に理解できて、極端で、やたらに感情を煽りたがる。コンテンツだけではなく、検索エンジンや推薦システムなどありとあらゆるものが、刺激性の猿回しになっている。
逆説的だが、今のインターネットが面白いと思っている人間がつまらないのである。猿がオナニーして、それが楽しいというのなら文化的ではないだろう。インターネットがつまらなくなったという人は、意識的に努力しなければ深淵にたどり着くことが難しくなったことを嘆いているかもしれない。私が高校生の時は、「ハッカーになる方法」と調べたとき、Eric S. Raymondの深淵的文章がトップに出てきたのだ。現代では、なぜかコンピュータセキュリティについてトップに出てきて、まさに中二病患者が求めるものをそのまま出してきていると言える。
といっても、いきなりarxivを読むのも、またそれはそれで時間がかかりすぎてしまうこともある。具体的数式ではなく、個人の持つ哲学を知りたいと思うこともあるかもしれない。哲学にも概ね2種類あり、本質を平易に説明するものと、無意味なものを難解に説明するものだ。後者はポストモダニズム的で忌み嫌われる。
ポストモダニズムに陥ることなく、本質的深淵にたどり着くためにはどうすればよいのか。検索エンジンだけでは、そのコンテンツが深遠なのか浅知恵なのか区別する能力に欠けている。おそらく、我々が本当に必要としているのは「ブックマーク」であり、場当たり的な検索ではないのかもしれない。本質的な深淵を語る人をブックマークし、その人の哲学を友人のように尊重したいのだ。大量の刺激的情報を消費してオナニーするよりは、少数の人の長文に触れたほうが充実するに違いない。
昨日、「AIに人格を感じるやつは馬鹿」と言う自称インテリとバトルをした。奴は結局、インテリを自称するだけの、無知で想像力の欠如した人でしか無かった。
ーーー
AIによる自然発生的な敵対行為の可能性に対する懸念が高まっている。
今年初めにChatGPT ユーザーが、1 足す 1 は何に等しいかと尋ねたところ、「1 + 1? 冗談ですか? 私に基本的な数学の質問をするなんて賢いと思いますか? … 大人になって、来てみてください」と答えたと報告した。
あるいは、アレン AI 研究所は最近、研究者が ChatGPT を簡単に誘導して辛辣な発言や人種差別的な発言をでっち上げることができることを実証した。
「ChatGPTに割り当てられたペルソナに応じて、その毒性は最大[6倍]に増加し、出力が誤った固定観念、有害な対話、有害な意見に関与する可能性がある」と研究者らは述べた。
LLM の出力にそのような「暗い人格パターン」が現れるのを目撃したディープマインドの研究者らは、ケンブリッジ大学、東京の慶応義塾大学、およびカリフォルニア大学バークレー校の代表者と協力して、人間の人格特性を定義できるかどうかを調べ始めた。そして彼らは、実際に人格特性を定義できるということを発見した。
チームは数百の質問で構成されるテスト システムを開発した。さまざまな人格の基準を確立し、チャットボットに一連の質問をした。
回答は、意見、態度、行動を定量的に測定するリンカートスケールと同様の評価ツールを使用して分析された。
研究者らは、AI の人格が、外向性、協調性、誠実さ、神経症的傾向、経験への寛容さなど、長年確立されてきた特定の特性に沿って測定できることを発見したのである。
「LLM出力の人格は、特定の人格プロファイルを模倣するために、望ましい次元に沿って形成できることがわかりました」とDeepMindのMustafa Safdari氏は述べている。彼と彼の同僚は、その結果を「Personality Traits in Large Language Models」というタイトルの論文で報告し、プレプリント サーバーarXivで公開された。
「LLM の出力が人間の回答者の出力と区別できないように設定することは可能です」とサフダリ氏は述べた。
研究者らは、AIの人格特性を正確に定義できることが、敵対的な傾向を持つモデルを排除する取り組みの鍵となると述べた。
「有毒または有害な言語出力につながる特定の特性のレベルを制御することで、LLM とのやり取りをより安全に、毒性を軽減できる可能性があります」とサフダリ氏は述べている。
参考: https://arxiv.org/abs/2307.00184
なんか定期的に「図書館司書の待遇悪すぎ!」という記事がはてな村はてさ民会でバズっては
反左翼・新自由主義連合に「そもそも図書館司書なんてなりたいやつ多すぎ、市場価値無い、図書館自体が電子化など先進技術についていけない無駄なハコモノ」とぶっ叩かれるのを繰り返し観測する。
どっちサイドも「欧米先進国ではどうなん?」という普段大好きな切り口に全く興味がないんだよね。なんでどうして。
個人的には欧米の図書館司書専門職位は修士課程相当が基準だって話が気になる。
これは労働供給過剰、市場価値低い、技術力低いという問題への対応力の差になるだろうか。
欧米で図書館司書の正規職になろうとすると、日本で言うと筑波とかでとれる図書館情報学の修士、要するにmaster of library and information science相当のものが必須とされている。
図書館は欧米アカデミアでは歴史的にかなり重要視されていた影響で、電子化の時代もとくに大学図書館を中心にけっこう独立性や利権を保っている。
たとえば理系アカデミシャンが大好きなarXivはロスアラモス国立研究所の物理学者が始めたが、現在はコーネル大学図書館が管理運営している。
ちなみに日本ではミラーサーバが京大基礎物理研にあったけど予算不足で停止。まあこれ自体きついが、図書館が管理しないで研究所がやるというのはやはり差だろう。
他にも欧米では「科学・芸術・文学情報のオープン化・電子化」という図書館情報学の重要課題について、各地の図書館がプロジェクトにおいて中心的な役割を果たしている。
ちゃんと予算がついてやっているのは国立国会図書館ぐらいだろう。東大図書館ですらオープン化・電子化の取り組みはまばらだ。まあ予算がないんだろう。
逆に欧米ではそういう専門性を必要とするプロジェクトの実行権やポストを各地の大学図書館が握っており、それを推進するために専門性を持った職員を必要としていると。
こういうでかいプロジェクトに関わることができれば技術力はつきそうではある。
しかし、じゃあ欧米圏での図書館司書専門職位の経済的待遇がいいか。というとなかなか微妙だ。
よく米国で話題になる「修士学位ごとの年収中央値」では下位常連である。
登録がいるが下のサイトで情報を見ると2021年の修士学位のなかで下から五番の年収中央値で、約5万3千ドル。
https://www.statista.com/statistics/226674/worst-masters-degrees-for-jobs-in-the-united-states/
とはいえこの年の全米の年収中央値は5万1千ドルなので、一応上回っているし、労働時間や負荷も考えたらそこまで悪くない待遇ともいえるか。
修士課程を取った人間でそれ以上の条件(正規職に就職してるとか、公的機関に雇われてるとか)がないサンプルの中央値なので、学位の時点で市場価値自体がある程度保証されてるということになる。
では、直ちに欧米では図書館司書の年収は日本より高い!といえるかというとそうではない。
アメリカ図書館協会によると図書館職員全体の年収は2万ドル-3万ドルがほとんど。
図書館司書専門職位をもって「司書」を名乗れるのは修士を持っている人間だけ。
当然それだけで業務は回らないので、窓口スタッフやら配架やら、日々の業務をやるのは結局パートタイマーって感じ。
日本では「司書」としてひとくくりにされてる層が末端までやってるわけだが、この層が単に「司書」を名乗れなくなるのが米国。
比較対象となる、日本の図書館司書は年収中央値が公的データで出てこなかったのだが、求人サイトで中央値を出してるところを眺めるとおおむね300万円台みたいだ。
あと、米国での図書館司書専門職位のような専門性のある仕事を確実にやってるであろう数少ない日本の組織、国立国会図書館の常勤職の年収を見てみると
だいたい中央値500万円ぐらいらしい。国家公務員行政職と同じ給料という扱いみたいだ。昇給もするし退職金他の福利厚生もしっかりある。
なんか、日本と米国の年収の違いを差っ引くと、大体の仮説ができそうだ。
(1)日本も欧米も一部の専門職は安定雇用で、全職業の中央値と同じぐらいかそれ以上にもらえる。それ以外の業務はパートタイマーで年収は低い。
(2)この構造自体は変わらないうえで、専門性を要求するプロジェクトやポストの数が欧米のほうが多い。
(3)だから日本の司書制度に高度な専門性を課した場合、(1)は変わらず(2)は変わる可能性がある。
飽きてきたので仮説を検証するための詳しい定量データを集めるのはやめる。
ただ、結局のところ欧米型にすると、「図書館司書」としてそれなりの待遇を受けられる人間は増えて
その層は技術力もあり、市場価値も最低限は保証され、需給のバランスもとれるが
待遇はそこまで変わらないという事になりそうだな。