2024-11-16

BlueskyはAIボットによるデータ収集許可している件

Blueskyにアップロードしたデータは、GoogleやOpenAIBaiduや様々な会社AI学習に利用されている可能性が高いよって話。

 

前提

検索エンジンAIクローラーボットによるデータ収集学習拒否する方法としてrobots.txtを使うのが一般的で、AI学習データ収集ロボットもそれに従っています

AI開発会社はそれぞれbot名前や、どのようにrobots.txtを設定したらデータ収集をしないかを公開しています

 

Blueskyのサーバーの設定(全部OK

User-Agent: *

Allow: /

https://bsky.app/robots.txt

https://bsky.social/robots.txt

 

全部いいよ。何も拒否しませんよ。お好きにどうぞって設定になってます

  

Xの設定(他社ボットによるデータ取集拒否

# Every bot that might possibly read and respect this file

# ========================================================

User-agent: *

Disallow: /

https://x.com/robots.txt

 

基本的な設定は全てのボットデータ収集拒否となっています

一部の検索エンジンには限定してデータ収集許可をしています。(詳細は長いので省略。自分確認してください)

 

Xは自社AIのみに利用される、Blueskyは他社AIに利用される。

Xは自社のAI学習には使われます

Xは他社のAI学習拒否しています

 

Blueskyは自社ではAI学習はしないと明言しています

Blueskyは他社AIボットによるデータ収集許可しています

BlueskyにアップロードしたデータはOpenAIGoogleBaiduなど様々な会社AIロボットデータ収集され、AI学習開発に利用される可能性が高いです。

 

Blueskyに画像をアップすると、様々なAI学習に使われそうです。

もしも自分AI学習に反対の立場なら、どのAIに使われるか不明なBlueskyの方が不安だと思うんだけど。

世の中はそうなってなさそうで不思議

 

1か月くらい前からXでこの事を指摘している方はいらっしゃいましたが、まだあまり広まっていません。

Blueskyに移住した反AIの方々がこれを理解したらどのような行動に出るのでしょう。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん