コピペで作られたものを、コピペであると判断するには、相当な情報量が必要だと思うけど… 論文ビッグデータにベリファイ(?)かける?(そんなの、あるかどうかは知らないが)
仮にそうだとしても、もう今の計算機の計算量だと大したコストじゃなくなってる。上に最適化技法は山ほどある。
何のためにハッシュ化の技術があると思ってるんだ。 論文で使用されている語彙をmecabとかで抽出して、使用頻度の多い語と使用頻度は低いけど特異なワードをの上から16~128個位をリス...
うむむ、NOSQLとかいうあたりですか?>ハッシュ化 (RDB脳のまま、かなり業界ブランクあるので、とんちんかんな事いってたらすみません。) サンデープログラマ的にもじょもじょして...
真面目に答えてやる。 「群盲象を撫でる」って諺は知っているな? 目の悪い人たちが、それぞれ象の一部分をさわりながら「これは固いから板だ」「いやいや、尖ってるから槍だ」「い...