2014-08-01

コピペで作られたものを、コピペであると判断するには、相当な情報量必要だと思うけど…

論文ビッグデータベリファイ(?)かける?(そんなの、あるかどうかは知らないが)

  • 何のためにハッシュ化の技術があると思ってるんだ。 論文で使用されている語彙をmecabとかで抽出して、使用頻度の多い語と使用頻度は低いけど特異なワードをの上から16~128個位をリス...

  • 仮にそうだとしても、もう今の計算機の計算量だと大したコストじゃなくなってる。上に最適化技法は山ほどある。

  • うむむ、NOSQLとかいうあたりですか?>ハッシュ化 (RDB脳のまま、かなり業界ブランクあるので、とんちんかんな事いってたらすみません。) サンデープログラマ的にもじょもじょして...

    • 真面目に答えてやる。 「群盲象を撫でる」って諺は知っているな? 目の悪い人たちが、それぞれ象の一部分をさわりながら「これは固いから板だ」「いやいや、尖ってるから槍だ」「い...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん