はてなキーワード: 転載とは
Google Drive のデータ消失不具合の陰に隠れているし、こちらは直接の被害はほとんどないが
今後もこの調子が続くならば、検索のGoogleという強みも、今後のAIでのシェアも揺らぐであろう事態が起きた
Google検索の試験運用AIや、Google Bard に日本での折りたたみスマホの普及率を尋ねると
(注:この増田を書いている時には学習元となった記事も消え、Google AIも40%を返さなくなっている)
2023年現在の日本では折りたたみスマホを持つ人はレアであり40%という数字は明確な誤りである、というのは前提としてほしい
しかしこの事件は、誤答の経路がハッキリしている点で他のAI誤答とは一線を画している
1.合同会社リュミエールデスポワールがPR TIMESに折りたたみスマホ40%のアンケート調査記事を出稿
[B!] 折りたたみスマホを持つ人の割合は40%!大きな画面とステータス感が魅力【フォルダブル購入動向調査】
https://b.hatena.ne.jp/entry/s/prtimes.jp/main/html/rd/p/000000038.000084641.html
[B! 読売新聞] 折りたたみスマホを持つ人の割合は40%!大きな画面とステータス感が魅力【フォルダブル購入動向調査】
https://b.hatena.ne.jp/entry/s/yab.yomiuri.co.jp/adv/feature/release/detail/000000038000084641.html
https://twitter.com/anago_lab/status/1729508419248218620
まず1.の会社がおかしなアンケート結果を連発していておかしいが、おかしいのは世の中にザラに居るので
PR TIMESに出すだけで読売まで流れて自動的に被リンク獲得できる、それはわかる
おかしな結果で目を引いてアクセスリーチに繋げる目論見なのだろうか
うちは企業のPRをそのまま流しているだけですよ、読売はPR TIMESを転載しているだけですよ
と言えば自社サイトで何流そうが知ったことではないという企業姿勢が丸見えだ
そして4.検索の雄Google様による企業ドメイン優遇の最近のアップデート
検索表示アルゴリズム更新の施策と下々のSEO対策とのいたちごっこは終わらないわけで
時には良かれと思ってした更新があだとなることもあるのだろうが
ここ最近は、検索結果もそこに表示される広告の質も低下が著しい
YoutubeやらChromeでは広告ブロッカーは排除しだす始末
一体Alphabetはどこへ向かってるの
5.AIはGoogleの検索結果を利用者にとって良いものにする方法とか
GoogleをEvilでなくする方法とかを人間どもに教えろください
Google Discoverが40%記事をpushしたところ
今回の発火点かな?
https://twitter.com/sm_hn/status/1729449613999186336
https://twitter.com/sm_hn/status/1729642842828484714
関連
https://twitter.com/Gadget_Simitaku/status/1728207888479666566
<追記>
嘘プレスリリースによるSEO実験記事。これで検索順位の高いフィッシングサイトを作れることが実証されてしまった
もっともらしい記事にもっともらしい内容で攻撃性の高いサイトが検索上位に来ていたらまずいよなあ
先日ニュースになった、自治体GoToドメイン跡地がパパ活やらカジノになっているより
GoToサイトのままっぽく仕上げてフィッシングの方が危険性あるように
<追記>
グーグルのAIが「折りたたみスマホ普及率4割」と嘘をつく。背景に「検索品質の劣化」や「新聞・リリース配信」のハック - すまほん!!
フリーレンの増田を書いた者なんだけど、勝手に転載された挙句にアフィの自作自演扱い、分断煽りみたいに書かれるのは心外。
5chに転載されたとしても話題になるのは、まとめサイト運営者が自分で増田に書いて自分でスレ立てをしてまとめブログに転載するための自作自演でレスしてスレを伸ばしてるものだけだよ
※追記
(まあ俺が第三者ならおもしろネットコンテンツとして同じ消費の仕方を考えるだろう
一応付言するが転載スレ立てすべてがアフィブログの自作自演炎上目的というわけではない)
【悲報】自分で投稿したはてな匿名ダイアリーをソースに嫌儲でスレ立て→アフィまとめする商法が横行
https://greta.5ch.net/test/read.cgi/poverty/1701136262/
ちなみに1つ目に挙げた増田を転載スレ立てした>>1は「そういう奴」だと嫌儲内(の一部)で認知されている(BEがバナナアイコンなので通称バナナ)
スレ立て履歴を見れば増田コピペ、男女分断ネタの多いことがわかるだろう
https://be.5ch.net/test/p.php?i=257926174
http://ame.hacca.jp/sasss/log-be2.cgi?i=257926174
※追記ここまで
・昨日のこれ
名無しの増田を「女さん」とすることで「女がまたイチャモンつけてる!」とレス数・コメント数・アクセス数がたっぷり稼げる
増田投稿のわずか5分後に5chスレ立て、増田投稿者のみに表示される鉛筆マークをコピーした時に出る「編集」の文字ごと>>1にコピペする雑さ、しかしアフィブログ「やらおん」では消される
なんで底辺や低学歴の男って『ゲーム』を好むんだ?安価な娯楽なら、読書とか映画とかあるのに何でわざわざ低俗なゲームを選ぶんだ?
↓
【悲報】女さん「底辺や低学歴の男って『ゲーム』好き多いけど、なぜ?安価な娯楽なら読書とかあるのに、何でゲームとか低俗な趣味選ぶの
https://greta.5ch.net/test/read.cgi/poverty/1701037581/
↓
yaraon-blog.com/archives/247262
joker004.blog.fc2.com/blog-entry-42394.html
・2日前のこれも
名無しの増田を「アニメ評論家」とすることで「偉そうな評論家様がまた適当言ってる!」とレス数・コメント数・アクセス数がたっぷり稼げる
↓
【悲報】アニメ評論家「葬送のフリーレンを観たが面白くない。かわいい女の子たちの旅に萌え萌え~!できる人しか楽しめないのでは」
https://greta.5ch.net/test/read.cgi/poverty/1700969697
↓
yaraon-blog.com/archives/247135
blog.livedoor.jp/qmanews/archives/52314029.html
iroirosokuhou.com/archives/38959797.html
frisoku.site/archives/2839
↓
気にせず転載すればいいやん
他言及でも書いたが一連の流れや動作原理についての資料は漁ってるし、日本の著作権法の条文は何回も参照してる あと科学技術は無謬じゃねえ
引用の要件を満たしているかを検証している段階でこの読み方をされるのはおかしいが、まじめに「完全に支配できるとお思いですか?」という問いに答えるならそりゃそんなわけない
世界情勢や経済を論ずる新書がなにも参考にせず本人の言いぐさだけで書かれてたら「引用してソース出せよ」って思うし、"家庭内"での私的利用によるコピーや"学校"での著作物利用について制限するほど著作権法がキツくないとかそういう基本は押さえてるつもりだが
AIの学習が人間のそれと同じという視点に立って書いており、先に書いた通りAIが引用の要件を満たさない転載を行った扱いなので「AIが」「無断で使用したデータを含む学習モデルで画像出力を行ったことが」「無断で使用されてしまった著作者(または権利保持者)の」「複製権(第二十一条)、公衆送信権等(第二十三条)、翻訳権(第二十七条)のいずれか、または全ての侵害にあたる」かな。AIに対して訴訟を起こすならこうって感じなので「半導体に訴訟起こすとか何考えてんだろ」とは思うが…
そっすね
動作として"入ってるデータのみ"を使った出力ならば、盛り込んだデータ数に関わらず「引用部分が従である」が成立しないので引用が成り立たないという話。
「学習モデル」って書き方は混乱するか。ここでは生成過程に注目していたので「モデルデータ」とかにしたほうが分かりやすいか。後で書くけど「すり替えて」はおらず「学習する段階の話」ではない
AIは新たに自分の頭で考えた要素を付け足さず、モデルデータから選んで切り貼りする以上の動作を行っていないので「著作物を引用した新たな著作物」とは言えず「転載物の集合体」として扱える(と考える)。モデルデータの中身が全部無断で使われた著作物なら、モデルデータの中身が6組なら無断転載6件、100億組なら無断転載100億件ってこと
なんで引用かそうでないかを考えたのかは「引用が成立するなら権利侵害ではない」は無断転載か検証するにあたりだいたい確認するから
多分「学習と引用をすり替えてる」前提に立ってこれを書いてて、かつ「AIの学習は人間の学習と同じ」にこちらが乗っかったからめちゃくちゃ面倒くさいことになってると思うので、もう「AIの指す"学習"と人間のやる勉強とかの学習は全く別」って観点で話進めるね
「著作物だけでイラストの描き方を学んだ」場合というかだいたいがそうだと思うが、絵の描き方を勉強する過程でサルまねやトレースを行う行為自体は著作権法では制限してない。トレパクとか模写自作発言とか無断転載(+自作発言)くらいの事態が起きたら著作者の権利を侵害した行為として評価がくだる
"画風パクり"が著作権含めどの権利を侵害してるのか?みたいな話は生成AI以前もたまにやってたが、だいたい特定の絵についてトレースや模写をしてなくて"参考にした画風の持ち主の名を騙っていない"ならとくに問題なしという結論が出たはず
じゃあ「生成AIは画風パクりだからセーフやろ」という話が上がってくると思うが、これは先に上げた「転載物の集合体」であることを考えれば"画風パクり"とは全く違うものであるので、画風という観点で判断してはいけない
AIに便宜上"学習"(Training)って言葉を使っているのでややこしいのであって、いわゆる学習モデルも実態は「入力パラメータ用ファイル集」なので"学習の成果"とは意味合いが違う
かなり前の方の増田でやった「学習モデルの再頒布禁止」という話については「生成AIを動かすために学習モデルを作る」ことは権利侵害にあたらないが「無断転載素材入り学習モデルの頒布」はガッツリ権利侵害だぞって話(これに"学習"って言葉つけないといけないからややこしい)
ただ生成AIのシステムもコンピュータープログラムである以上「プログラム動作時のデータ処理の流れを追うログ出力コードを盛り込むことは不可能」なんてことはない
だからそんなことできないの
まさかそちらから具体的なアルゴリズムの名前を出してくるとは思わなかった
ニューラルネットワーク(以下NN)の内部動作は、人間が指示を出してNNから返された出力を見て「どんな考え方したらこんなアイデア出てくるんだよ思考回路マジわからん」というのがだいたいなので、これも便宜上「ブラックボックスだね~」と言っているにすぎない
NNがたとえば古代アステカ文明の遺跡から発掘された謎の箱をパソコンに繋いだらAIになったとかいう代物なら間違いなくブラックボックスと呼んで差支えない
だが実態は"アルゴリズム"なので、NNはなんでも作れる不思議な箱ではなく、入力層・多層の中間層・出力層を設けた計算手順にすぎない。NNの参考書読んで人力で計算しても(時間かかるし高難易度関数のオンパレードだが)再現可能ではある
参考にしているStableDiffusionも動作原理もアーキテクチャも明らかなので、人間に再現不可能なブラックボックスではない。プログラムを実装してるのがエリートのプログラマであるってだけの人間だし
実際は「学習モデルに入ってる画像とテキストの組み合わせ」が0個だからその経路では「転載」になんざなりようがねーんだよ
1組でも入ってると主張するならcivitaiから適当な.safetensor拾ってきてどこに入ってるのか具体的に言ってみろよ
「いくらか還元せよ」は主題としている部分からズレてはいるが、理解としてはおおむね合ってそう
別の言及にもこれから返信するつもりだけども、ここまで書いてて、よく考えたらOpenAIが「権利侵害の賠償金肩代わりするで」って言ったらIT大手が「何言ってんだライセンス料払ってたらやってらんないわ」って言い放った話が出た段階で、この"生成AIは権利侵害をしているかどうか"の議論はとっくに終わってるはずなんだよな。NovelAIも違法転載だらけでおなじみdanbooruからデータ引っ張ってるって宣言してるし…
東北ずんだの榊正宗が長文お気持ちで「無名に著作権なんかねえよ(意訳)」発言をぶっ放したり、あちこちの論争でもそうだが、権利侵害ではありません!のラインにわざわざ戻ってバトルしてるのが変なんだよな
まだその「人間の学習過程と同じだから問題ない」論使ってるのか
わざわざ学習モデルの頒布公開に的を絞ったのに生成物まで話を広げるって言うならそのベースで書くわ
AIと人を同一視していいのであれば、生成過程からして「多量の既発作品のみで構成された出力情報」ということになり、本人(=AI)が手を入れた部分が極端に少ないか無であり、またその他引用の要件を満たさないんで「転載」扱いで「AIが権利侵害を行った」とみなせる
人間の目では分からないレベルのデータなんだからいいだろうと思うだろうが、AI自体は内部処理を把握してるんで「どこにどの既発作品を持ってきた」か追えるんで、人間と同じ視点に立たせるのであれば転載の責任は負える
人間と学習過程が同じとするならなおのこと問題なんだよ。著作権侵害については親告罪で、権利者当人が立件しない限りは罪状は成立しないが、その事実をもって(立件するための証拠を作るのが困難である点から目を逸らし)生成AIは受け入れられるべきものとか言って踏ん反り返ってるからそこらじゅうで議論が加熱してるんでしょうよ
「ネット民の力を信じる」「スゴイ一体感を感じる」的なノリに冷静に距離置かせるカバオコピペがあったので2chは良いって棘が人気だけど
https://b.hatena.ne.jp/entry/s/togetter.com/li/2258034
そのコピペって2ch全体で貼られてた訳じゃないぞ。当時の2chは全能感全開だったぞ。
そんな中で特異だったのがこのコピペで、隣組破りというか異端というか、かなりの軋轢があって叩かれてたぞ。
元の「スゴイ一体感を感じる」の投稿がされたのは毎日新聞変態英字記事に対する炎上の中だったのが、この毎日の記事は単独のものじゃなかった。
当時、毎日のWEB版では時々変な性的な記事が載って一部の好事家の間で話題になっていた。
例えば愛染恭子というポルノ女優が居るんだが、彼女が紙面で夫婦間のセックス指南をしたり、関係が無いような社会現象でセックスが原因だからとまたセックス指南したりと結構訳が分からん記事を書いていた。
昭和40年代に「表現者」というアングラジャンルがあって、自分の性的な事を全面に出して芸術や芸能と結びつけるという表現形式が流行っていた。
三島由紀夫の聖セバスティアヌスとか『薔薇刑』とかはこの流れのものだ。宮台真司なんかがやたら自分の性体験を赤裸々に語るのも同じ流れにあるし、国民的アングラ女王椎名林檎の『歌舞伎町の女王』とかもそうだな。
多分この延長で「赤裸々な性」のコンテンツを目指したのではないかと思われる。
また紙の方に載っていたかも未確認だ。紙の新聞の日曜版は風変りな特集記事が載るし、また折り込み形式の特別版ともなれば全然新聞記事っぽくない、ミニコミ紙みたいな記事も載る。
そういう垣根で分かれていない、フラットなWEB版ではそれらはとても奇妙な記事群だった。真面目な記事と並列で愛染恭子などのセックス相談が載ってるというアレな状態だ。
炎上後直ぐに記事が見れなくなって増田は見てないのだが、そういう記事が英語に翻訳されて居たのではないか?という気がする。
ネットvs.旧メディアの図式でそれらのうち、「日本の娘はセックスが好きで」みたいな記事が炎上し、ROM人という法科大学院卒の人物が中心になって行ったのだが、当時の2chはかなりの全能感の中にあった。
郵政選挙で小泉純一郎は旧弊な既得権益に侵された日本vs.本来性を目指す右派革新という図式を提示して勝利し、2chもこの流れに乗っかっていた。今から見ると非常に紅衛兵っぽい。
変態記事想騒動は2008年の初夏であるから、この熱気支配されていて、迂闊に疑念を表したりすると叩かれてパージされてしまう。だから反対意見を態々いう者はほぼ居なかった。
また、大事なのは、犯罪予告連続逮捕事件群が2008年の冬にあった。「よーし、お父さん埼京線の上野駅で連続殺人しちゃうぞー」「学校の校庭で小女子を焼き殺します」が有名だ。
この事件群の以前には、ネットでの犯罪予告は全く逮捕されていなかったのだ。だから責任感とか全く考えず、その場の勢いで法人や個人を罵倒したりいわれのないデマ書き込みしたりが放置されていた。
これも全能感を加速させた。「あの新聞のこの記事は自分の一昨日の書き込みに反応したものだ」とかいうヤバゲな奴とか大量にいた。
そんな感じで冷や水を掛ける人がいない環境であった2chだが、幾つかの例外があって、その一つがガイドライン板、通称ガ板だった。
ガイドラインと言いながら運営上のガイドラインを議論するんじゃなくて、あるテーマに沿った面白コピペ収集やバカレスの晒しが大半だ。
ガ板ではそんな2chの全能感に水を注すようなコピペ収集が以前からされていて目を付けられていたんだが、「スゴイ一体感を感じる」のレス転載は一連の運動を馬鹿にするのが見え見えだから当然「〆る」つもりの反発も食らった。
だが、「スゴイ一斗缶を感じる」とか「すごい水上置換を感じる」とかの改変が多数行われると面白過ぎて盛り上がり、隣組圧力を突き放す形になった。
そもそも法科大学院を出た後にちゃんと就職しておらず、身分も精神も不安定であった。渦中の毎日新聞を提訴したのだが、そもそもこういう日本人の名誉=自分の不利益というのは反射的利益であって原告適格性を認められない。その法的文書も酷くて法科卒とは見えないレベルだった。
そして自殺予告や未遂を起こし、あまりに精神不安定さに同居家族がネットに書き込んで「これ以上持ち上げないで」と懇願するに至った。
因みに彼も1000万円を超えるカンパを得ている。
最近では見る事が少なくなったが、ネット中毒を拗らせて精神を病む、人格が社会から完全に乖離する、ゆえに破滅するというのは良く見られた。彼もその一人だ。ネットから引き離さないと直らないという典型的な状態だ。
こうして運動の方は自然消滅していった。カンパの1000万がどうなったかは知らん。
だから「すごい一体感」は2chの冷静さじゃなくて、全能感や一体感の隣組的圧力を意に介さなかったガ板の冷静さであった、ということ。
更に「ネット民の力を信じるすごい一体感を感じる」的ノリというのは、恥ずかしいもの、では済まず、結構悲惨で親族や本人の人生を巻き込んだ大仰な結果に至っているのだ、ということ。
https://anond.hatelabo.jp/20231106153626
実際にやってみるとわかるけど、
日本語の豊富な書き分け(「オレ」と「俺」、あと「漢」と書いて「おとこ」と読ませるルビ)が非常に翻訳困難。グチャァとベシャッなどオノマトペの使い分けにも慣れてない読者多いし。
アニメローカライズは動きがあるから楽だけどそれでも主人公が背中向けた瞬間日本語にない余計な説明セリフをしゃべりだすジブリ映画たくさんあるやで。
小説原稿をつくるときWORDにいうことをきかせる(自然にルビをつけ行間をあけさせない)からのピクシブ転載用ルビ変換すらかなり難しいから日本人未来をいきすぎなんよ
めんどくせええええええ