はてなキーワード: Google検索とは
飽きた。はじめは「成田成田うっせーな……せや!何者か増田で調べたろ!」という軽い気持ちで始めたが、こんなにも時間がかかるとは……
ちなみに内容の正確性は確認してません。もう疲れたよパトラッシュ状態なので、気が向いたらやる(多分やらない)
参考:
[老人の集団自決発言の何がヤバかったのか解説する](https://anond.hatelabo.jp/20240316075359)
[アンチ成田「老人に集団自決とか言うな!!!!!!!!!!!!!!!!!!!!!!!!!!!」 老害権力者「そうだそうだ!wwwwwwwwwwwwwwwwwwwwwwwwwww」](https://anond.hatelabo.jp/20240316022929)
[なぜタマキ○ンは老人大量虐殺おじさんをCMキャラクターに起用しようと思ったのか](https://anond.hatelabo.jp/20240314131813)
[例の発言のほかは変な眼鏡で視力悪くなりそうという印象しかないな](https://anond.hatelabo.jp/20240313201752)
概要:
というかじゃあ君らはChatGPTとか使わないということでいいの?
本文:
前提として,反AI絵師は「自分の著作物を生成AIの学習には使うな」という主張をしているように見受けられて,それ自体は別にいいんだけども他の著作物に対して目端が効いていないように思える,という認識がある.
そもそも人間が生成した全ての創作物には著作権が生じるもので,この観点からは絵も音楽も文章も等しく尊重されてしかるべき.
なんだけども反AI絵師は絵だけを過剰に特権化しているように思える.
この文脈での「反AI」のAIは,ほぼ「生成AI」とイコールという認識なんだが,となると文書生成に対しても反対しなければ筋が通らない.
なのだけれども,ChatGPTに代表されるテキスト生成やGithub Copilotに代表されるソースコード生成(提案)に対しては何も言っていない.
Whataboutismじゃねえか,と言われるかもしれないが,生成AIの代表であるChatGPTにおいてテキスト生成部分と画像生成であるDALL-Eが並列にメニュー上に存在している以上,そこを完全に別物だと主張するのは無理がある,と考える.
というかChatGPTに「こういう画像を作りたいのでDALL-Eに渡すプロンプト生成してくれ」って指示も可能だしな.
というわけで,この文脈で「反AI」と言った場合,画像生成とテキスト生成の両方に対して反対の立場に立っている,立っているべきである,というのがここまでの話.
で,生成AIは何もないところから生成できるわけではなく,学習するデータが必要になる.
反AI絵師はそこで「自分の画像を使うな」という主張をしていると理解している.
別にそう主張しても構わないとは思う.
思うんだが,じゃあテキスト生成もソースコード生成も,さらに突き詰めると検索エンジンも使うなよ,というのがここからの話.
テキスト生成も画像生成と同様に学習するテキストが必要になる.
で,そのテキストをどこから持ってきているのかいえば,インターネット上に存在する文書となる.
そして(大抵の場合において)インターネット上に存在するテキストには作成時点で著作権が発生してて,それを勝手に学習してテキスト生成に使っている,というのが現状の生成AIがテキスト生成を行う場合の振る舞いとなる.
上記の文における「テキスト」を「画像」に置き換えたものに対して反対の立場を取っているのが反AI絵師,という理解なんだが,であれば当然テキスト生成に対しても反対すべきだろう,と思う.
思うんだが,本当にその辺は反AI絵師はどうでもよいらしく,ChatGPTとそれに付随するDALL-Eも特段の問題としていないように思える.
一貫性の観点からは,著作物に対して同意を得ていない学習に基づく生成全てに対して反対の立場を取るべきでだろうと思えるのに,反AI絵師は画像生成以外を問題とせず,よく分からない特権を振りかざしているように思える.
絵を描く人間だから画像生成以外に対しては放置する,という主張なのかもしれないが,生成AIの生成対象が拡大している現状,その主張は「彼らが最初共産主義者を攻撃したとき」と変わらんのではないのか.
そもそも,Google検索の最初のバージョンはPageRankベースだったわけだが,これは「多くのWebサイトからリンクされているページは価値が高い」という尺度に従って構築されている.
あるページにリンクを張る,つまりリンク先のページに価値があるのかを評価するのは,リンクを張った人間であり,つまりその価値を生成しているのは人間なわけだ.
そして人間が生成した価値をもとにリンク先のページの評価を決める,というのはつまり複数の他人の脳みそのいいとこどりをしているに他ならない.
生成AIに反対するのが「自分が描いた絵にフリーライドして価値のある絵を生成しているのは許されない」という主張であるのならば,他人の脳みそにフリーライドしてページに価値を付けている検索エンジンも同様に許されないものであるべきだ.
これは「生成AIの反対するならば検索エンジンも使うな」という主張の根拠になる.
別に本気で言ってるわけではないんだが,反AI絵師がどこまで考えて主張してるんだろうか,という疑問はずっとある.
1. 反AI絵師の主張を丁寧に拾ったわけではない雑な話なので「藁人形論法」と言われたらそうかもしれん
2. 「反AI絵師」の「AI」が指し示す対象が「生成AI」ではないかもしれん
ただし著作権の適用対象の公平性の観点から「画像生成AI」に限定した議論を特別視できる理由はない
個人的には画像周りへの対応は,検索エンジン避けみたく「画像生成の学習に用いられることに同意しません」みたいなタグを埋め込む形での対応になりそうな気がしてる.
そしてそのタグが普及せずになし崩し的に画像についても生成AIが一般化するんじゃねえかなあ.
あと,「現状,PageRankそのままでは使われなくなってねえか?」という主張は妥当なんだが,だからといって何もかもが変化したわけではない.
結局人間の脳みそにフリーライドするのが一番効率いいのには変わりないしな.
Github Copilotは優秀だけど,だからといってあれがpilotになるわけではない(正解「案」を提示するのと正解を提示するのとの間にはマリアナ海溝よりも深い溝がある)のと同様に,画像生成も人間のそれを(少なくとも完全には)代替できねえんじゃねえかなあ,と思う.
上記の文章は最近うだうだ疑問に思ってたんだけども,「絵師の立場から言いたい「反AI」の人の態度について(https://note.com/magic_clover2991/n/n0ec2827346af)」読んで,頭の中の整理も兼ねて書くか,という気持ちになったので書いた.
厳密に言わないと理解できない点が、君がアスペたる所以ではないかな?
判例を調べれば「Google検索はインフラ」と認めていることぐらいは見つかるよね?
裁判所は「一般的な検索エンジンはインフラに当たる」と指摘し、自社サイト上でのグーグルの行動は自由だとの見解を退けた。
https://www.bloomberg.co.jp/news/articles/2021-11-10/R2CPE1T0G1L101
今後、どうなるんだろうか?
自動車で得られる経済性の方が遥かに大きいから損失には目をつぶる
同じように諦めと妥協で収斂するのか
現在は検索エンジンがAIで真偽有益性を判定しページランクつける技術移行の最中
とはいえこれもすぐに破られるのではないか、あまり期待していない
FacebookもYAHOOもセカンドライフもやりたかったのはこれなんだが、ダメでしょ?
ネットの広大な世界に小綺麗な町を作っても自給自足の閉社会にはならんのよ
ここでも現実社会と同じストロー現象が作用して瓦解する、毎度これの繰り返し
っていうタグを見かけた。
生成AI と現在普及してる「普通の」AI って何が違うんだろうね?
じゃあ違いはなにかって考えると結構難しくて、使われてるアルゴリズムだけに注目すると、言語モデルのTransformerは機械翻訳も使ってるし、Google検索をするときにも使われてる(BERT)。画像とかのDiffusion モデルは知らない。(今どうなったか知らないけど、Transformer の画像生成モデルが計算量少なくて結構いいかもみたいなのは聞いた。)
これらは少なくとも使い続けてきたし、生理的なキツさはなかった(翻訳家であったりはあったと思う。あと、自分は、物心ついたときからそこにあったからイマイチわからんってのもある)。
だからそこの違いってのは量的なものだと思うんだよね。量的な変化が質的な変化を生む(more is different )。
自分が、このエントリだけを学習させたとしても、その精度の低いモデルは生成AIとは言わないだろうし。
計算量だけを取ってきたりしても、モデルを蒸留させるとか、そもそもの計算効率の上昇とかで変わってきちゃうし。
どれが生成でどれが生成じゃないんだろうか?
google検索の劣化について、首がもげるほど同意した。というか個人的にタイムリーすぎてびびった。
というのも月曜に、子供の自由研究みたいなの手伝って星のベテルギウスについて調べたのね。そしたら重さのところにkg以外にMみたいな記号があったから、なんやろって思ってiPadで「星の重さ M」でぐぐったら↓のサイトが2位ぐらいにひっかかちゃったのよ。(ほんとうはURL貼りたくないのだが)
https://planetariodevitoria.org/ja/espaco/quantos-quilos-tem-uma-estrela.html
で文章が変なのでAI生成くさいなと思いつつもちょろっとスライドしたら、brave(基本広告消してくれるブラウザ)で見てたのに隅の方に「私の口に〇液出したいですか?」みたいなエロ広告(画像自体は女性の口)がでてきて、えらいびびった。あーbrave貫通広告もあるのか、というかサイト自体が完全にアフィだったら1つや2つ貫通するわな・・・という新たな気づきを得ました・・・。
で、すぐ×ボタン押して消したんだが、このサイト駄目だねってなって他のマシなサイトを探した。(ちなみに答えは太陽質量といって、太陽の質量を1とした単位らしい。Mと変な記号(〇の中に点)をつなげて書く)
俺は表現の自由戦士だし、エロがダメって言いたいわけじゃなくてね。単に欲してないときに見たくないだけなのよね。で子供も本人が見たいなら止めないつもりだが、積極的に見せるつもりはないのね。だからpushで見せようとしてくる広告は本当に屑。そのアフィサイトを弾けない検索エンジンも屑だし。せめてbrave自体がアフィサイト自体を検索結果から弾いてくれればいいんだが、そこまではできてないもよう。
で、そのアフィサイトはgoogleだと出てくるのでデフォルト設定をbingに変えた。仕事で使ってる分にはbingよりgoogleの方がいい結果がある場合もあるんだが、今回の件で屑サイト率はbingの方が低いのではないかと思ってとりあえず様子見。
あとは、ホワイトリスト形式で*.jpだけ指定出来たら結構なアフィ対策(ドメイン代が高いのでアフィサイトが基本使わないはず。)になるんじゃないかと思うが、さすがに巻き添えで見えなくなるサイトが多すぎるかなと思う。
あとはブコメで挙げられていたBing Copilotとか有用そうなので今度使ってみたいと思う。
とりあえずBing Coplilotの厳密モードで調べるようになった。気楽に使えてノイズは少し抑えられる。
https://b.hatena.ne.jp/entry/4749236552742528576/comment/PerolineLuv
もしみんなのおすすめ設定があれば教えてほしい。
Google検索トップに出てきた某料理のレシピが「炊飯器で作れる!」系で、
しかもそれを「その料理本来の」レシピと勘違いした旦那がそれで作ってしまい、
まあ不味いとは申しませんがやっぱり普通にフライパンで作ったほうが断然うまいよねって出来でした。
作ってもらっておいてこんなこと言うのあれですけど、レシピ調べるならせめていくつか横串で調べて、
「どのレシピでも共通してやっていることは外しちゃいけない必須事項、それ以外の可変事項は各レシピの独自アレンジ」
そうすりゃ許容範囲とか省略していいこととかがわかって小回りが利くでしょ。
見てみりゃ炊飯器で作るのもフライパンで作るのも手間なんかたいして変わらんかったとですよ。
せいぜい「スイッチ押してしばらくは放っておける」くらいのもんで。
まあそれこそが炊飯器レシピのメリットなんでしょう、きっと。色々忙しい子育て中の兼業主婦とかには。
でもうちはそうじゃないし。
旦那の料理なんか半分楽しみでやってるんだから、わざわざ本線からはずれて省力レシピに走る必要性皆無だし。
炊飯器の前で腕組んで待ってるんだったらフライパン振ったほうが早くできるよ。
独特のクセつよアレンジレシピに走る前に定番レシピを定番通りに作れるようになるほうが先。