“なんなら今の長瀬じゃなくて10年とか20年前の長瀬出せって言ってる感がある”
まあでもこういう気持ちわかる
「おやすみカラス、また来てね。」という漫画はほとんど大泉洋の当て書きてだと思うが当然今の本人には無理で、マンホールの頃の大泉洋がいまいて演じてくれたらなあとか思ってしまうからな
既知のCSAMについてはハッシュ化したうえでデータベース化し、疑いのある画像とマッチングするという手法が広くとられています。
perceptual hash‐based detection
LAIONによって確度0.995以上でunsafeと判定されているサンプルを全て抽出し、画像URLをPhotoDNAで検証
マッチしたサンプルをProject Arachnid Shield APIを通してC3P (Canadian Centre for Child Protection)に検証してもらう
CSAM判定されたCLIP特徴を記録
cryptographic hash‐based detection
NCMECの保有するMD5データベースを用いてLAION-5Bに含まれるCSAMを検出
この手法は既にリンク切れになってCSAMか判別できないサンプルに対しても一定の検出を行うことができます。LAIONは各画像のMD5をまとめたものをlaion2B‐multi‐md5, laion2B‐en‐md5, laion1B‐nolang‐md5といった形で公開しており、このMD5をNCMECの保有するデータベースと突き合わせることができます。このcryptographic hash-based手法はrecallが低くなるものの、MD5の一致を見るだけで良いので50億全てのサンプルを走査することができます。
記録したCLIP特徴でk近傍法を行い、データセット全体から類似画像を検索
PhotoDNAで検証
PhotoDNAでは分からなかった画像をダウンロードし、Thornの提供するCSAM分類器で判定
あらたに認定されたCSAM画像のCLIP特徴からk近傍法を行い、上のステップを繰り返す
この類似度検索によってunsafe値に依らない検出を行うことができ、さらにPhotoDNAでマッチしない未知のCSAMも検出することができます。しかしながらC3Pでの検証は人力であり、類似画像をすべて投げるわけにはいきません。そこでThornの分類器によるフィルタリングを挟んでいます。
みつかったCSAMの特徴
あまり詳しい統計は載っていないのですが、Reddit, Twitter, Blogspot, WordPressといったCDNや、XHamster, XVideosといったアダルトサイトのドメインが含まれているようです。またサイトの特徴として"teen models"やヌード、日本の"junior idol"コンテンツが多くヒットしているとしています。
https://qiita.com/__dAi00/items/90521cc333924196a7ba
原文読んでないからそのつもりで
日本の法律が実在児童ポルノに限定してしまっているせいで、膨大な数のリアルな児童ポルノ写真に見える画像の中から、違法とするには実在している子供の画像を探さなければならず、二次元が実在児童を救う取り締まりの邪魔になっているのは知ってる。
お前も警戒されてるよ
これ…?じゃないよね。
なんか指標によってだいぶランキング違うから何を基準にして言ってるのかよくわかんないよね。
https://digital.kyodonews.jp/gender2024#
これだと東京が一位で、政治家とか校長、就職率、共働きの家事率とか社長とかの男女比みたいなことからランキングつけてるぽい。
みぬき言葉?(難視
お前は東大に行け