2024-11-17

anond:20241117153817

AIゴミも含めて大量にクローリングしてデータを集めた後に選別してから学習する

ゴミが増えた所で困るのは人間だけ

  • どっかで見たけど壊れた画像を大量にネットに流して学習ノイズにするのは面白い案だと思う。

    • 優しくない増田ばかりなので、なんで意味がないと言われるか説明するね 基本的に、学習前には集めたデータのフィルタリングを行うので、ゴミはそもそも除外されることが多いんだ ...

      • 何万と必要な学習セットにフィルタリングの手間なんかかけないだろう。 自動判別させて対策するしかないけど微妙に嫌われる画像を機械にも 人間にも区別のつきにくい形で大量にアッ...

        • まぁそのわざわざ有料で販売されてる物も無料でいくらでも入手出来るんで意味無いんだよなぁwwww

          • 現在は無料でいくらでも手に入るが大量にゴミ画像が出回るとだんだん探す手間が増えてくる。 一時期割れソフトが出回った時にわざと壊れたファイルをアップするってのがあったけど...

            • AIはゴミも含めて大量にクローリングしてデータを集めた後に選別してから学習する ゴミが増えた所で困るのは人間だけ

              • ゴミが増えた所で困るのは無料の画像を探している人間だけなので絵師は困らない むしろ >AIはゴミも含めて大量にクローリングしてデータを集めた後に選別してから学習する こちらの...

        • どんなデマに騙されたかは知らないけど、数百万枚どころか数千万枚のデータセットでも当然フィルタリングするよ

    • そんなもん意識的に作るまでもなく溢れかえってる種類のデータなので、当然のように対処されてて意味ないぞ。

    • それ全然意味ないんスよw

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん