2024-04-27

生成AI学習させる データセット とは

99%の確率で お前たちがネットに置いた生の画像テキストをただ集めた物 ではありません

これもひとつデータセットですが 規模が大きくなるほど 真面目に作ろうとするほど 加工と選別をしなければ使い物になりません

この 加工と選別等により改造されたデータセット それが真の 学習データセット となります

決して 著作物Aを使ってるからA`が生成できる という事は意味しません

いつもありがとう お前たち

知識基盤のすり合わせを 頑張りましょう

  • 学習用データをきちんと金かけて選別したらAIの性能上がったってマイクロソフトがどっかで言ってたなぁ。 イーロン・マスクがツイッターのデータを学習に使うって言ってるけどツイ...

    • えーデータの民主化じゃなかったの? 文化資本の差でAIにも格差できちゃうじゃん

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん