単に保存したいだけの人が割を食う一方 学習用途としては別にソースが高解像度である必要はないのでキャプるだけで済む
いうて相当数の学習データはいるから手動キャプチャはきついやろ。ファインチューニングレベルだと少なくても行けそうだけど
えっ手動でするの!?
ブラウザでしか見れないってそういうことやからな。seleniumみたいなやつ使えば自動化もできそうだが
少なくともdanbooruへの転載とタグ付けは今でも完全手動でやってるわけじゃん?
あれって手動だったの?いまいちdanboolの存在意義わかってないけど
10年くらいで結構な人員(ネット上のアスペとオタク動員)をかけてな… まあ転載の転載(タグデータごと)みたいなのもあるけどあれだいたい人力だしなあ
へー、10年前からあったのか全然知らんかった。今頃注目されるとは
あれAI研究者がやるの無理よね 企業でもどうか怪しい
つか研究者もあのデータ使うのは倫理的にアウトやな
Google翻訳を使うのも倫理的にアウト
google翻訳ってそんな怪しいデータ使ってたか?
「画像にどんなものが描かれているか、どんなシチュエーションが描かれているか、誰が作ったものか、一言でもいいから可能な限りたくさん説明がついていて、そしてそれが画像本体...
・ 画像そのものを保存しているわけでも再出力するわけでもない ・ タグの文言そのものは文章ではない というとってもめんどくさいとこを突かれた形なのよな ある意味ヤラレ損である...
学習自体は問題ないんだから、徹頭徹尾danbooruの問題じゃん
結局、元絵の作者がAI学習に許可してるかどうかが全てだからやっぱ問題よ
許可なくてもやっていいよって法律があるんですよ……
法律に縛られてるなんて思考停止じゃないか