生成AIに学習させる データセット とは
99%の確率で お前たちがネットに置いた生の画像やテキストをただ集めた物 ではありません
これもひとつのデータセットですが 規模が大きくなるほど 真面目に作ろうとするほど 加工と選別をしなければ使い物になりません
この 加工と選別等により改造されたデータセット それが真の 学習用データセット となります
決して 著作物Aを使ってるからA`が生成できる という事は意味しません
いつもありがとう お前たち
知識基盤のすり合わせを 頑張りましょう
Permalink | 記事への反応(1) | 01:25
ツイートシェア
学習用データをきちんと金かけて選別したらAIの性能上がったってマイクロソフトがどっかで言ってたなぁ。 イーロン・マスクがツイッターのデータを学習に使うって言ってるけどツイ...
えーデータの民主化じゃなかったの? 文化資本の差でAIにも格差できちゃうじゃん