「ArXiv」を含む日記 RSS

はてなキーワード: ArXivとは

2024-11-16

Xはイラスト学習なんてしていない

Xが学習に使いたいのはテキストの方

そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。

  

Grokとは

わかりやすさのために ChatGPT比較してみる。2023年リリースされた GPT-4 に試しに今期のアニメについて質問してみよう。

 

今期最も人気のアニメはなんですか?

ChatGPT:

2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?

 

アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題対応できないのである

一方、Grok は Xの投稿リアルタイム検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロブリーチ辺りの話をするはずだ。つまり、Xが収集したいのはダンダダンの7話泣かされたわ・・・みたいな投稿のことであってイラストではない。

 

Grokの画像生成機能は何か?

Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラスト収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である

 

LAIONとは

現在大手企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?

このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織ネット上のありとあらゆる画像収集タグをつけたデータセットを公開している。

LAIONのFAQ から引用

Q. 私の著作物があるのでデータセットから除いてください

A. LAIONは非営利研究組織です。ドイツ著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています

 

とあるようにドイツ法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。

  

尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本法律関係ないです。いちおう念の為

 

AIのGlazeの使い方は間違っている

AIさんが迷惑な暴れ方をしている。

他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。

 

もう、全てが間違っている

  

そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのであるpoisoned って書いてあるでしょう?!)

相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)

それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。

事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる

  

Glaze/Nightshade とは

AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。

Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念無茶苦茶になってしまう。

 

図:毒入りモデルの変化   (arXiv:2310.13828から引用)

 

上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。

 

図:毒入り枚数による変化  (同引用

 

こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。

 

 

余談0

XでAI(Grok)の学習に使って欲しくない人は

設定とプライバシープライバシー安全→Grok 

から学習許可のチェックを外すと良い

  

余談1

もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru投稿するだろう。二次元イラスト特化の画像生成AIdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである

 

余談2

ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?

Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。

  

余談3

Glaze が機能しない?あるいは解毒方法が見つかったかもしれない

 

 

上のスレッドコメント欄では Glaze が論文のようには機能しないことについて議論され「画像リサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データ圧縮されてノイズ効果が消えたのではないかということだ。

  

A) 絵師さんが Glaze をかけたあと画像を縮小した可能

B) 画像サイズファイルタイプによってはプラットフォーム側が勝手に加工をする

C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)

 

A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)

 

尚、上の議論に関しては誰も検証をしていないので注意。

  

余談4

LAIONは収集画像のものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい

ということは、LAIONの新しいデータセットが公開されたタイミング画像urlを変更すれば学習に使われることを回避できそうだ。特に個人サイトブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフSimple Attak に相当)

 

90年代においては画像直リンクされたとき報復としてうん●画像差し替えものです。まさか令和になっても有効とはね

 

余談5

この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインおすすめもとても静かだ。攻撃的な人たちやデマに流されやす人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。

2024-10-22

SNSに居場所がない

SNSってほんとクソだよなぁって思うんだよね。ゴミ情報下水道しかねぇ。

お前のことなんて知らねーよ

対面で会ったこともねぇ連中の私生活開陳を見せられて何が面白いんだ?

お前がいくらネット上で俺と親しいようなフリをしようと、すげぇ浅ぇの。

あらゆるコンテンツ政治

画像とか動画のようなコンテンツだとしても、イラッとするようなのが多いんだよな。

誰かを非難するためだけに書かれた漫画とか、選挙動画とか、俺は興味ねぇの。

イライラさせるミーム

猫とかミームとか見てるとキレそうになるんだよね。

なんでこのゴミを俺に見せるんだろうなって。

有益情報RSSで十分だろ

numpyのアップデートを追う?githubRSSフィードで追うとか、そういうのでいいわけで、Xのnumpyアカウントフォローする必要はねぇよな?

最新の数学研究について知りたい?arxivRSS購読すればいいよな?

検索Googleで十分だろ

情報を調べるためにSNSを使う奴って頭悪いのかな?

有名人という名のウゼェ連中

あのな、俺は世間が「有名」とする人間に一切の興味はねぇの。

第一、連中の目的は売名だろ?乗せられてどうする。

発信?お前や俺のことなんて誰も興味ねぇよ

なんで発信してるの?そんなゴミ情報を。男女論?弱者男性論?フェミニスト?ウゼェだけだろ。

フォロワーイイネインプを稼ぐ?なにが面白いの?

ゴミゴミを煽ってるだけだろ。イライラするだけ。

SNS機能がクソ

Xの最もクソな点は、おすすめトレンドリツイート。俺の興味のないことを表示するからイライラが勝る。

では有益な使い方は存在するのか

SNS有益な使い方は、

1. 実際に対面で会ったことのある人間との交流

2. ゲームの最新情報を追う。

3. 政治とは無関係アート作品を鑑賞する。

ぐらいのもんだな。

まとめ

俺は対面で会ったことのある人間SNSをやってねぇし、ゲームもやらねぇし、アート作品にも興味がねぇから場所がねぇの。

2024-09-24

貧困層高卒数学研究で成果を収める方法

無名状態ではarxivのendorsementを得ることが出来ない。AI提案したパスとしては、以下のいずれかがある。

2024-09-10

俺のダチがHaskellとかLeanとかに興味があるっつーんだけどさ、ニートなんてやめて仕事しろって感じなんだよね

仕事するとなると、Haskellとか言ってらんないっしょ?

わかるよ、数学コンピュータサイエンスマスターしたいというその心意気

でもさぁ、結局数学コンピュータサイエンス論文として発表しなきゃ成果ゼロだし、君はArxivで分野のendorsementを獲得できないでしょ

無意味無意味論文なんてのは

本当に研究したいなら、企業研究しろ

2024-09-06

anond:20240906155453

増田です。ありがとう、君みたいな人をずっと待ってたよ。

結局自分の肌がどれくらい健康なのか、何が足りなくてなにが過剰なのかを知ることが慣用で、問題がある場合にはそれが緩和されるような成分を選ぶ、というのが成分との付き合い方かと思う。

成分を気にしないといけない、気にしたほうがいいのは、その製品効能の主となる成分、製品のメインコンセプトに係る部分であり、おまけ程度に「XX配合!」とか謳ってるのは正直賑やかしにすぎないことが多い。

完全に同意。肌状態を正しく把握して理想的状態に至るために何が必要かを知ることを抜きにしたスキンケアは、病気じゃないのに薬飲むのに等しい。そしてこの部分って正にスキンケア話題において語られない部分であるように思う。

例えば医療であれば、素人自分状態を知ろうとする場合医療機関での診察や検査を受けることで定量的データやそれに基づく専門的見解を得ることができる。自分美容クリニックもそれなりに利用しているが、そういう抜本的な検査というのは一度も受けたことも提案されたこともない。無論、弊増田が単に無知なだけでそういう対応を受けられる機関ごまんと存在しているのかもしれないが。よく肌タイプが云々みたいな話を見かけるが、あれは何の根拠があって言っているのか、それ16personalitiesより信憑性あるのかな?と常々考えている。

俺は、俺たち彷徨える「清潔になりたい男」たちは、一体どうやって正しく自分現在地点を知ればいいんだ。誰にそれを尋ねればいい? それが分からいからこそ、とりあえず細胞間脂質層の50%を占めるセラミドを塗布すればいいんだなと早合点してしまう俺のような哀れな羊が今も、ここが何処なのか、これから何処へ向かえばいいのか、何も分からないまま彷徨っているんだ。

ビタミンCとかビタミンA(レチノール)に関しては外用でのデータも多いけど、安定した形で化粧品に配合するのが難しかったりで、成分として配合されているといって効果が期待できないこともある。

通ってたクリニックの医師からビタミンCイオン導入でないと殆ど浸透しないと教わっていたんだが、同時にそのクリニックでビタミンC配合の化粧品販売していてどっちなんだよと思ったことを思い出した。ビタミンの外用に関するデータ自体結構あるんだな。PubMedarxivみたいに手軽に全文読めれば追従やすいんだが・・・・・・

2024-06-11

プログラマーになるために学位不要

まず「ソフトウェアエンジニア」という肩書名を使うやつは、かっこつけたがってるだけで、実質プログラマーと大差はない

で、プログラマーとしての知識インターネットがあれば99.9%学べる

学位は、単に4年学んだふりをしたという紙切れでしかない

一度企業に入り込んで経験を身につければ、あとは実力の世界

「僕はCS学位をもってまーす」ということしかイキれない無能の出番はないだろう

2024-05-29

anond:20240529110055

まず、Twitterでも論文の最新情報を追うようなことは可能

"AI papers"のようなArxiv論文専門のアカウントがある

またAI papersがフォローする専門家アカウントフォローすれば、最新論文の共有情報が見れる

ではTwitterの何がいけないかというと、一つはおすすめアルゴリズムがクソっていう点

学術情報が知りたいと思っていても、政治対立や男女対立情報おすすめしてきたりするのでノイズになる

あとは英語圏ツイートに対して引用リツイートリプライしても反応が薄いこと

これは諜報機関国家境界ボーダーを敷いており、干渉を防いでいるためと言われている

要は「英語に目を向ければ最新の研究情報特に論文)を知ることはできるけど、ノイズが多いし、自分からの発信の価値はない」という話

2024-05-12

[] 2024-05-12

グリゴリー・ペレルマンは昔から政治が嫌いだったらしい。

友人と会話して政治的なことが出ると「◯◯君、それは政治だよ」とピシャリと指摘したと聞く。

ミレニアム懸賞問題論文を提出し、それが評価される過程での政治が発生したときは「俺は政治家じゃねぇ!」とキレたようだ。

金も辞退し、数学から手を引いてからは、オペラの鑑賞を趣味として質素生活をしているらしい。

誰も解けない問題を解き、arxivに成果を出すことで出版社存在する政治を避け、数学証明の正しさだけで勝利を勝ち取った男がペレルマンその人である

このストーリーを聞いて私は、この人こそ尊敬に値する数学者だと思った。

研究助成金をもらうための政治活動に熱を入れる数々の自称研究者とは格が違う。

私もまた、政治厨が嫌いな市民の一人である

政治とは関係のないことを趣味としてやることを望んでいる。

数年前はgithubOSSを公開することがそういう趣味だと思い込んでいたが、スター数で評価されるという政治存在することに気が付き、消極的になった。

社会でなにか評価されようとすることが政治なのだろう。ポアンカレ予想ですら中華が業績を奪おうと政治工作したのだから

私はプログラミング趣味仕事の両方でやっているが、コンピュータインターネットを通じて社会と繋がりすぎている。

から世間自分比較して、自分ダメだと落ち込んで幸福度を下げているのだ。馬鹿らしい。

社会とは適度に距離をおいたところにある趣味が、本当に私がやりたかたことかもしれない。

2024-05-05

[] 無限の多世界無限に大きくなる可能性がある

神はサイコロを振るだけでなく、想像はるかに超える数の部屋があるかもしれない。実際、無限にある。

1世紀わたり量子力学の旗の下にある理論観測によって、現実理解は複雑になってきた。

物体が速度や位置といった絶対的尺度を持っていた時代は終わった。

これは直感的な宇宙観とは程遠い。コペンハーゲン解釈として知られるようになったものでは、可能性の波があるように見えるがそうではない。

現在でも何が最終的にシュレーディンガーの猫の運命を決めるのかはまったく明らかではない。

ヒュー・エヴェレットは1950年代に、可能性のあるすべての手段がそれ自身現実構成していることを示唆した。

この現象特別ものにしているのは、たまたまあなたがそれを観察しているという事実にすぎない。

エヴェレットの「多世界モデルは、量子力学絶対的な奇妙さを具体的なものに置き換える方法である

可能性のある無限の多元宇宙、あるいはグローバルハミルトニアンとして知られるすべてのエネルギー位置の総和のようなものから出発し、興味のあるものズームインして、有限ではるか管理やすハミルトニアンのサブシステムの中で無限を制約する。

しか無限理解する手段として、この「ズームイン」は足を引っ張ることになりはしないだろうか?

別の言い方をすれば、シュレーディンガーの猫が箱の中で生きているのか死んでいるのかを容易に尋ねるかもしれないが、その下のテーブルが温かいのか冷たいのか、箱が臭くなり始めているのかどうかは考えない。

研究者たちは、箱の中身に注目し続ける傾向が重要かどうかを判断するために、ポインター状態として知られる量子の可能性が、他の状態よりも少し頑固に設定され、いくつかの重要性質エンタングルするかどうかを検討するアルゴリズムを開発した。

もしそうならシュレーディンガーの猫を説明する箱は、宇宙はるか彼方に広がる可能性のある長い要因のリスト考慮しない限り、ある程度不完全である

エヴェレットの多世界から出発して、研究チームは多世界解釈と呼ぶものを考え出した。無限可能性のセットを取り出して、我々が通常考えないような現実無限範囲を掛け合わせるのだ。

オリジナル解釈と同様、この斬新な解釈は、宇宙の振る舞いについてというよりは、宇宙一口ずつ研究しようとする我々の試みについてのものである

研究者たちは、このアルゴリズム概念的な重要性はあまりないと強調しているが、コンピューター内部のような量子システムプローブする優れた方法を開発する上で応用できるのではないかと考えている。

他の現実に、すでにその答えがあることは間違いない。

この研究はまだ査読を受けておらず、arXivで公開されている。

https://arxiv.org/pdf/2403.10895

2024-04-28

anond:20240428130856

ググって出てくる情報は 誰かが思いつきで書いてて最後まで書いてないし

企業公式で書いてるドキュメントとかOCWとかarxivとか知らなそう

ソフトウェア技術の99.9%はインターネットから学べるのでググる力を身に着けましょう

こんにちは、皆さん。今日は少し物議を醸すかもしれないトピックについて語りたいと思います

それは、「ソフトウェア技術の99.9%はインターネットから学べるのでググる力を身に着けましょう」という考え方です。

現代ソフトウェア開発者にとって、インターネットは最も重要学習リソースの一つです。

オンライン上には無数のチュートリアルドキュメンテーションフォーラムブログ記事論文があり、それらは私たちが新しい技術を学び、問題解決するのに役立ちます

しかもこれらはソフトウェエア技術のほぼ全分野をほぼ網羅しており、見つからない情報はありません。MIT OCW, arxiv, github, kaggleなどなんでもあります

ググる力」とは、情報効率的検索し、適切な情報を見つけ出す能力のことを指します。

これは、適切なキーワード使用したり、信頼性のある情報源を識別したり、関連性のある情報抽出したりする能力を含みます

ソフトウェア開発は常に進化しています。新しい技術フレームワークが日々生まれ既存のもの更新され続けています

このような環境では、すべてを覚えることは不可能ですが、必要情報を素早く見つけ出す能力があれば、それが可能になります

私の主張は、すべてのソフトウェア開発者自分自身で学ぶこと、そしてそのための最良のツールインターネットであるということです。

そして、そのためには「ググる力」を身につけることが不可欠です。

2024-04-15

ITの利点はネット環境コンピュータがあれば容易に学べること

学歴価値必死擁護する連中がいる

労働というのは価格の安さまたは質の高さで勝負する必要があるが、学歴で足される質なんてものはないに等しい

なぜなら大学で学べることはネットで学べるから

一般的ネット情報の他にarxiv, MIT OCW, github, kaggleなどリソースは大量に存在する

学歴というサンクコストに囚われてインドの安労働の連中に負ける

負けていることが悔しいから「僕は高学歴です」とイキる

どうしようもねぇなこいつらは

2024-04-02

arxiv.orgに403って言われるんだけど俺だけ?

2024-03-29

anond:20240329215015

実験系と測定側の境界を置けばね

あとArxivは勘弁Nature載ったら教えて

2024-02-10

anond:20240210073041

宇宙法則を変えるなら相転移ですね。

究極理論がわからない現状、もし仮に「我々の世界不安定真空にいる」ことを仮定すれば

相応のエネルギーを加えて真の真空に落とす(相転移させる)ことで物理法則が変更されるという

人為的ネオエクスデス「うちゅうの ほうそくが みだれる!」 ができますね。

イメージ的には過冷却です。すでに相転移が起きているのに気がつかないで元の真空にとどまっていますちょっと突くと一瞬で凍ります

  

現に、新しい加速器が作られる度になんかスゲェ無理矢理な模型を作って「加速器のせいで世界が滅びる!」系の論文arXiv投稿されたりします。意外と増田と同じことを考える人がいるんですね。ただしこれらの論文は一瞬で否定されます。なぜならば、加速器で作るビームなんかよりも中性子星ガンマ線バーストのほうがよほど強いからです。宇宙強い。人類技術は弱い。驕るなよ人類

  

 

から不思議だったけど、これらの法則って経験から導き出されたものであって、その法則がどうやって存在してるかは不明なんだよな

 

以下、意味は取らなくて良いので流れと単語だけ拾ってください:

 

宇宙法則対称性で決まっています

保存則はネーターの定理から導き出されます

たとえばエネルギーの保存は時間方向の並進対称性運動量保存則は空間方向の並進対称性から、角運動保存則は回転対称性から導き出されるといえるでしょう。

相対論的には時間空間は同時に取り扱うのですがちょっと難しくなるので簡易な書き方をしています

    

運動方程式最小作用の原理から導き出されます

時空の対称性が決まる → ラグランジアンが決まる  → オイラーラグランジュ方程式運動方程式

  

 

ここまでよんだ?

なら次は、ランダウ・リフシッツ「力学」の最初の20ページくらい読んでください。

前提知識微積分です。ここまで読めば上の文章はだいたい理解できるかと思います

 

そして次にあなたはこう思うでしょう

 

最小作用の原理っていったいなんなんだ? 世界はなぜこんな原理に従う?」

  

そう思ったなら次は量子力学です。JJサクライ「現代量子力学」の経路積分のページまで読み進めましょう。

ここまでくれば霧が晴れるように見通せるようになるはずです。

物理理論とは何であるかが把握できるかと思います。ここから先はご自由に。

  

 

なお、JJサクライは物理科ではちょっと ’進んだ’ 内容とされています普通は2冊目に読む本ですね。が、ハテナーにとってはむしろ読みやすい本かと思いますだってどうせ君ら情報系でしょ?なんかプログラムとか書ける人たちでしょ??なら、ブラケット表記の方が慣れていると思うんですよ。たぶん見ればわかるよ。

 

 

2023-12-15

anond:20231215205255

字下げ増田君も論文書いてarxivに載せるといいと思うよ。

2023-12-09

ネットには無限に近い選択肢がある ← 脳障害発言

ネット社会なんて似通ったことばかり主張してるよ

ネットがつまらない理由個人主観問題ではなく、実際につまらなくなってるから

面白い人はリア充化してるし、つまらない人がネットに入り浸って釣りだの煽りだのやってる

主要なSNSはほぼ「釣り」が目的化していると言っていい

反応を最大化しようとして極端なことや言葉遣いを使う連中だらけ

ネットの中に面白いコンテンツがあるとすると、それは10年以上前に書かれた文章だったりすることが多く、それはアフィカスやバズり目的支配される前だったと言える

あるいはarxivのような論文サイトであれば少しは楽しめるが、コミュニティサイトという感じはない

コミュニティサイトで唯一関心があるのはstack exchangeだ。X、reddit、Quora等、人格破綻者のパヨクが多い。

はっきり言おう。ネットがつまらないのはパヨクリベラルのせいだ。ハフポスト見てるか?お前らパヨクネット破壊してるんだよ。

2023-12-07

[]2023年11月滅多にホットエントリを出さなドメインからホットエントリ

ここ1年で初めてはてなブックマーク日毎の総合人気エントリ入りしたドメインからホットエントリブクマ数順トップ30

ブクマタイトルドメイン
1359国土交通省 ネガティブ情報検索サイトwww.mlit.go.jp
1087ゲーム趣味にしている人の割合が多いのはどのくらいの収入の人たちなのか調べてみた - nonameのノートnoname774300.hatenablog.com
854マシュマロ!|高河ゆん|pixivFANBOXkouga-yun.fanbox.cc
850トコジラミ根絶方法害虫・害鳥獣安全対策します|株式会社 オオヨドコーポレーションテックス社oyodo-pmp.com
847ラマヌジャンは本当に何も知らなかったのかmathlog.info
774裏紅白歌合戦2023jiyujoho.a.la9.jp
679水は変わった物質vitroid.github.io
671しずかなインターネットsizu.me
606日米でエンジニアの育成戦略正反対だと気付いた話 - メソッド屋のブログsimplearchitect.hatenablog.com
498ゼルダの伝説 ブレスオブザワイルド』が品質を高めてくれた。売上10万本超え、R18インディーゲーム洗脳アプリ高慢お嬢様を好き放題するシミュレーション開発者インタビュー - AZ-LINE あずらいん!az-line.jp
484ChatGPTに社内文書に基づいた回答を生成させる仕組みを構築しました - コネヒト開発者ブログtech.connehito.com
475映画批評ゴジラ-1.0』90点(100点満点中)movie.maeda-y.com
465メールアドレスキーにしてID連携を行う設計の危うさ|ritousizu.me
454「直接会って話したほうがはやい」は速いだけ|arayasizu.me
438ベンダ提供していない決済モジュール不具合による情報漏洩事故 東京地判令2.10.13(平2810775) - ITシステム判例メモitlaw.hatenablog.com
436Othello is Solvedarxiv.org
435池田大作氏の御逝去の報に接しkishida.gr.jp
424https://ip.guide/ip.guide
421ナポリタンが究極の味になる!ほんのひと手間に「やって大正解」「今度からこうする」 - macaronimacaro-ni.jp
421大麻少年の性被害、男らしさの病(松本俊彦)[第12回] 酒をやめられない文学研究者タバコがやめられない精神科医の往復書簡ohtabookstand.com
407変なドメイン取るな.netwww.henna-domain-toruna.net
401mRNAのひみつ | まんがひみつ文庫 | まんがでよくわかるシリーズ学研キッズネットkids.gakken.co.jp
377雑記セキュリティガイドライン類 約300時間 読み漁ってみた - 2LoD.secnikinusu.hatenablog.com
374弊社元幹部社員不正について/日本海テレビwww.nkt-tv.co.jp
368t_wadaさんと「単体テストの使い方/考え方」の疑問点についてディスカッションしました - DeNA Testing Blogswet.dena.com
361コラム寄稿「なぜドイツ人にできることが日本人にできないのか」www.rieti.go.jp
360令和時代個人サイトの作り方:suama workstechbookfest.org
356楽天市場】SPUの特典内容変更について|SPU(スーパーポイントアッププログラムevent.rakuten.co.jp
345国産プレミアムウイスキー 一部商品価格改定についてwww.suntory.co.jp
335Mini vMaclrusso.github.io

2023-10-28

今のインターネット面白いと言う奴はつまらない

インターネットがつまらなくなった、と言う人がちらほらいることに気がついている人もいるかもしれない。皮肉を言いたがる鬱陶しい人は、すぐに「それはお前がつまらなくなったからだ」と言うが、それは物事のほんの一つの側面でしかない。

長文を読むことが苦手な人のために、結論から述べようと思う。インターネットがつまらないのは、人々がタイパと刺激を求めた結果である。限りある人生有効に使いたい。ここまではよかったはずだ。だが世の中を見渡せば、「簡単理解できるコンテンツ」「刺激的なコンテンツ」「感情を煽るコンテンツ」で溢れている。マスターベーションを覚えた猿が繰り返すように、インターネットから刺激性を学習した猿は狂ったようにスクロールする。

私がソフトウェアブログを書いていた時、あることに気がついた。難解でユニークアルゴリズムを公開するよりも、「○○のインストール方法」といった初心者コンテンツのほうがアクセスが多いのである。何かをインストールする方法など、ドキュメントを見れば一発でわかるのに、ブログアクセスしてくる。いや、検索エンジンドキュメントではなく私のブログTop誘導するのがそもそもおかしいだろう。悲しいことに、ドキュメントちゃんと読める人が少数派であり、平易な言葉で書かれたブログの方を好む人が多いということだ。

個人的価値観を述べれば、インターネットに私が求めるのは「深遠」であるゲーム理論確率微分方程式を組み合わせたらどうなるのかとか、プラグマティズムソフトウェア工学に適用するAndy Huntの最新の哲学的考察を知りたいとか、そういうことだ。

深淵理解には時間がかかる。タイパと刺激の発想とは逆だ。一見退屈に見える無刺激な長文を、ゆっくりと地道に隅々まで理解しなければならない。深淵は真面目でストイックで、人生を共に歩むように接する。コンテンツを書いた人間個人として尊重し、友達と語り合うような気分で読み解くのである

コンテンツは見て射精して賢者タイム。それで終わり」というのが現代人がやっていることだ。インターネットは元々学術的な(つまり深淵的な)情報交換のために作られたが、今では娯楽(つまりオナニー)が大半を占めている。そういう消費者に合わせて作られたものは、簡単理解できて、極端で、やたらに感情煽りたがる。コンテンツだけではなく、検索エンジンや推薦システムなどありとあらゆるものが、刺激性の猿回しになっている。

逆説的だが、今のインターネット面白いと思っている人間がつまらないのである。猿がオナニーして、それが楽しいというのなら文化的ではないだろう。インターネットがつまらなくなったという人は、意識的努力しなければ深淵にたどり着くことが難しくなったことを嘆いているかもしれない。私が高校生の時は、「ハッカーになる方法」と調べたとき、Eric S. Raymondの深淵文章トップに出てきたのだ。現代では、なぜかコンピュータセキュリティについてトップに出てきて、まさに中二病患者が求めるものをそのまま出してきていると言える。

といっても、いきなりarxivを読むのも、またそれはそれで時間がかかりすぎてしまうこともある。具体的数式ではなく、個人の持つ哲学を知りたいと思うこともあるかもしれない。哲学にも概ね2種類あり、本質を平易に説明するものと、無意味ものを難解に説明するものだ。後者ポストモダニズム的で忌み嫌われる。

ポストモダニズムに陥ることなく、本質深淵にたどり着くためにはどうすればよいのか。検索エンジンだけでは、そのコンテンツが深遠なのか浅知恵なのか区別する能力に欠けている。おそらく、我々が本当に必要としているのは「ブックマーク」であり、場当たり的な検索ではないのかもしれない。本質的な深淵を語る人をブックマークし、その人の哲学を友人のように尊重したいのだ。大量の刺激的情報を消費してオナニーするよりは、少数の人の長文に触れたほうが充実するに違いない。

2023-10-16

anond:20231016114632

プレプリント以前にWord論文書いてるのが信じられねぇ

今時論文なんてほぼtexしか書かんのだからそのままarXiv投稿して終わりやろ

2023-09-27

AIには人格がない」と言う想像力欠如人間

昨日、「AI人格を感じるやつは馬鹿」と言う自称インテリとバトルをした。奴は結局、インテリ自称するだけの、無知想像力の欠如した人でしか無かった。

さて、AI人格性について面白い論文があるので紹介しよう。

 

ーーー

AIによる自然発生的な敵対行為可能性に対する懸念が高まっている。

今年初めにChatGPT ユーザーが、1 足す 1 は何に等しいかと尋ねたところ、「1 + 1? 冗談ですか? 私に基本的数学質問をするなんて賢いと思いますか? … 大人になって、来てみてください」と答えたと報告した。

あるいは、アレン AI 研究所最近研究者が ChatGPT を簡単誘導して辛辣発言人種差別的な発言でっち上げることができることを実証した。

「ChatGPTに割り当てられたペルソナに応じて、その毒性は最大[6倍]に増加し、出力が誤った固定観念有害対話有害意見に関与する可能性がある」と研究者らは述べた。

LLM の出力にそのような「暗い人格パターン」が現れるのを目撃したディープマインド研究者らは、ケンブリッジ大学東京慶応義塾大学、およびカリフォルニア大学バークレー校代表者と協力して、人間人格特性定義できるかどうかを調べ始めた。そして彼らは、実際に人格特性定義できるということを発見した。

チームは数百の質問構成されるテスト システムを開発した。さまざまな人格基準確立し、チャットボットに一連の質問をした。

回答は、意見、態度、行動を定量的に測定するリンカートスケールと同様の評価ツール使用して分析された。

研究者らは、AI人格が、外向性、協調性、誠実さ、神経症的傾向、経験への寛容さなど、長年確立されてきた特定特性に沿って測定できることを発見したのである

「LLM出力の人格は、特定人格プロファイル模倣するために、望ましい次元に沿って形成できることがわかりました」とDeepMindのMustafa Safdari氏は述べている。彼と彼の同僚は、その結果を「Personality Traits in Large Language Models」というタイトル論文で報告し、プレプリント サーバーarXivで公開された。

「LLM の出力が人間回答者の出力と区別できないように設定することは可能です」とサフダリ氏は述べた。

研究者らは、AI人格特性を正確に定義できることが、敵対的な傾向を持つモデル排除する取り組みの鍵となると述べた。

「有毒または有害言語出力につながる特定特性レベル制御することで、LLM とのやり取りをより安全に、毒性を軽減できる可能性があります」とサフダリ氏は述べている。

 

参考: https://arxiv.org/abs/2307.00184

 

https://anond.hatelabo.jp/20230927010839

2023-08-07

anond:20230806152814

まじでこれなんだよな。

arXiv ミラーみたいな現代に求められてるもの提供できたなら、図書館司書必要性理解する人も増えただろうにね。

実際に日本図書館司書がやってるのは本の整理とかたいした生産性のないことばかり。

そりゃあ、お前ら全員クビだ!!に納得なんだよなー。

2023-08-06

ところで欧米図書館司書専門職位は修士課程相当って知ってた?

なんか定期的に「図書館司書待遇悪すぎ!」という記事はてな村はてさ民会でバズっては

左翼新自由主義連合に「そもそも図書館司書なんてなりたいやつ多すぎ、市場価値無い、図書館自体電子化など先進技術についていけない無駄ハコモノ」とぶっ叩かれるのを繰り返し観測する。

まあそれ自体はいいんだけど、気になるのは

どっちサイドも「欧米先進国ではどうなん?」という普段大好きな切り口に全く興味がないんだよね。なんでどうして。

個人的には欧米図書館司書専門職位は修士課程相当が基準だって話が気になる。

これは労働供給過剰、市場価値低い、技術力低いという問題への対応力の差になるだろうか。



欧米図書館司書正規職になろうとすると、日本で言うと筑波とかでとれる図書館情報学の修士、要するにmaster of library and information science相当のもの必須とされている。

専門職修士要求するというのはなかなかの高水準だろう。

図書館欧米アカデミアでは歴史的にかなり重要視されていた影響で、電子化時代もとくに大学図書館を中心にけっこう独立性や利権を保っている。

たとえば理系アカデミシャンが大好きなarXivロスアラモス国立研究所物理学者が始めたが、現在コーネル大学図書館管理運営している。

ちなみに日本ではミラーサーバ京大基礎物理研にあったけど予算不足で停止。まあこれ自体きついが、図書館管理しないで研究所がやるというのはやはり差だろう。

他にも欧米では「科学芸術文学情報オープン化・電子化」という図書館情報学の重要課題について、各地の図書館プロジェクトにおいて中心的な役割果たしている。

日本場合はどうか、というとかなりしょぼい。

ちゃん予算がついてやっているのは国立国会図書館ぐらいだろう。東大図書館ですらオープン化・電子化の取り組みはまばらだ。まあ予算がないんだろう。

逆に欧米ではそういう専門性必要とするプロジェクトの実行権やポストを各地の大学図書館が握っており、それを推進するために専門性を持った職員必要としていると。

こういうでかいプロジェクトに関わることができれば技術力はつきそうではある。


しかし、じゃあ欧米圏での図書館司書専門職位の経済的待遇がいいか。というとなかなか微妙だ。

よく米国話題になる「修士学位ごとの年収中央値」では下位常連である

登録がいるが下のサイト情報を見ると2021年修士学位のなかで下から五番の年収中央値で、約5万3千ドル

https://www.statista.com/statistics/226674/worst-masters-degrees-for-jobs-in-the-united-states/

学費が高く物価も高い米国では修士としては低い。

とはいえこの年の全米の年収中央値は5万1千ドルなので、一応上回っているし、労働時間や負荷も考えたらそこまで悪くない待遇ともいえるか。

まあ日本の「司書」の平均待遇に比べたら雲泥だろう。

修士課程を取った人間でそれ以上の条件(正規職に就職してるとか、公的機関に雇われてるとか)がないサンプルの中央値なので、学位の時点で市場価値自体がある程度保証されてるということになる。




では、直ちに欧米では図書館司書年収日本より高い!といえるかというとそうではない。

アメリカ図書館協会によると図書館職員全体の年収は2万ドル-3万ドルほとんど。

図書館司書専門職位をもって「司書」を名乗れるのは修士を持っている人間だけ。

当然それだけで業務は回らないので、窓口スタッフやら配架やら、日々の業務をやるのは結局パートタイマーって感じ。

日本では「司書」としてひとくくりにされてる層が末端までやってるわけだが、この層が単に「司書」を名乗れなくなるのが米国

比較対象となる、日本図書館司書年収中央値公的データで出てこなかったのだが、求人サイト中央値を出してるところを眺めるとおおむね300万円台みたいだ。

あと、米国での図書館司書専門職位のような専門性のある仕事を確実にやってるであろう数少ない日本組織国立国会図書館常勤職の年収を見てみると

だいたい中央値500万円ぐらいらしい。国家公務員行政職と同じ給料という扱いみたいだ。昇給もするし退職金他の福利厚生もしっかりある



なんか、日本米国年収の違いを差っ引くと、大体の仮説ができそうだ。

(1)日本欧米も一部の専門職は安定雇用で、全職業中央値と同じぐらいかそれ以上にもらえる。それ以外の業務パートタイマー年収は低い。

(2)この構造自体は変わらないうえで、専門性要求するプロジェクトポストの数が欧米のほうが多い。

(3)だから日本司書制度に高度な専門性を課した場合、(1)は変わらず(2)は変わる可能性がある。



飽きてきたので仮説を検証するための詳しい定量データを集めるのはやめる。

ただ、結局のところ欧米型にすると、「図書館司書」としてそれなりの待遇を受けられる人間は増えて

その層は技術力もあり、市場価値も最低限は保証され、需給のバランスもとれるが

現在の低待遇人材は「図書館司書」ですらなくなって

待遇はそこまで変わらないという事になりそうだな。

暇なはてな民もっと調べてみてくれ。

ログイン ユーザー登録
ようこそ ゲスト さん