Blueskyにアップロードしたデータは、GoogleやOpenAIやBaiduや様々な会社のAI学習に利用されている可能性が高いよって話。 前提 検索エンジンやAIのクローラー、ボットによるデータの収集...
自分でPDS立てて拒否robots.txt書けるんじゃない bsky何も知らないのにこんなエントリ書くの反AIと同じくらいダサいと精神だと思うがそんな自分を増田自身はどう自己評価しているのか気...
まだβ版で将来の互換性も保証されてない機能捕まえて「できる」と言う方がミスリードだと思うぞ
https://atproto.brid.gy/robots.txt 不安な人には↑みたいなDisallow運用のやり方を指南しててあげるほうが格好いいと私は思うね 元増田のやり方は反AIと同じ匂いがする 近寄りたくないタイプだな...
AI各社はそれを守って情報収集するんだろうか
XでもBlueskyでもどこのSNSでも画像収集はされるからとりあえずクリスタのノイズかけとけって言ってる
Glazeは信用してない 生成AIが動くPCでもこいつは重すぎて動かない なんかしてるように見せかけてるインチキかウィルスを疑ってる https://anond.hatelabo.jp/20241115224208
タイッツーも外部のクローラーはCloudflareで対策してるらしいけど金払えばAPI使わせてもらえるしな どこのSNSでも学習されるしXも自社以外から当然学習するだろうし
まぁXは私のあげたデータ全てAI学習に使われるのを同意しますって同意しちゃってるから、仮に将来AI学習に同意が必要と法整備されても自由に使われちゃうよね。
どこに行ってもAI屋のクローラーがrobots.txtなんか余裕で無視してユーザーエージェント偽装してブロックリストすり抜けて画像収集してるので同意とか全く意味ないんだが
どこ待て本人の同意なく個人情報をAIが利用してもいいかとか国が話し合ってんだから、同意の有無は関係あるっしょ。 ツイッターに上げてる人は、子供や自分の顔写真とエロアカウン...
サーバのブロックリストを偽装ですり抜けてスクレイピングしてくbotに合意の有無とか関係ないだろと言ってるんだけど…
robots.txtごときに強制力ないし、破ったところで罰則もないって話やで
取得できる出来ないで言えば、いくらでも抜け道はあるのは自明の事。 大事なのはそれぞれのプラットフォーム(Xやbluesky)がどのような方針であるかを理解する事。 また、robots.txt...
性善説は全く信用していない 大手だから大丈夫、については大手だから何?会社の規模で法律変わるの?と思っている 絵描きはrobots.txtなんて気にする暇があったらネットに絵を上げる...
Xは自社でAI学習するので、そのためのデータは自社独占しようと外部からのアクセスを阻もうとする。 一方ブルースカイは自社でAI学習する気がないので、データを独占する意味も保護...
20241116171005 に書いてて、周回遅れ(それも10周以上)で草