それいいね。後は、間を抜かすアルゴリズムだね。 250超えたら一つおき、で..

それいいね。

後は、間を抜かすアルゴリズムだね。

250超えたら一つおき、でもよいかも。

int(文字列長/250)文字おきで圧縮する。

とか書きつつ。

http://search.cpan.org/~gaas/Digest-1.15/Digest.pm#Digest_speed

数字が小さいほうが高速、ではなく大きいほうが高速。

これはperlなんだけど、LLで下手に演算するより、バイナリのライブラリを使ったほうが高速らしい。

ちなみに使う言語はpython。

幾つか実装してベンチとってみよ。案外md5が一番早かったりしてｗ

Permalink | 記事への反応(1) | 14:23

記事への反応 -

ハッシュ関数を調べた
http://anond.hatelabo.jp/20090326142330 の続き pythonでベンチとった。試した方法は以下 md5hex: md5を使う crc32x4: 4分割してそれぞれcrc32にかけてつなぐ headtail: 初めの16文字と終りの16文字をつなぐ ...
- ハッシュ関数を調べる
  セキュリティ目的ではない。ハッシュテーブルで使うような奴でキャッシュで使いたい。手軽なほうが良い。軽いほうが良い。推測可能でよい。数十バイトくらいの文字列にしたい。 md5...
  - http://anond.hatelabo.jp/20090326123924
    ただの連番でよくね？
    - http://anond.hatelabo.jp/20090326124554
      連番ってどういうこと？順方向に探査すれば？ってこと？何に使いたいか具体的に書くと、とある処理でwebページを取得するのだけど、その時、urlをキーにmemcachedでキャッシュしよう...
      - http://anond.hatelabo.jp/20090326132358
        URLの最初の100文字程度と、最後の100文字程度をくっつけたとしたら、実際に使われているURLでは殆ど衝突しないのではないだろうか？
        http://anond.hatelabo.jp/20090326135358
        頭１００バイトと尻１００バイトで思いついたけど、網目キャッシュなんてどう？あらかじめ250バイトって制約があるなら、・250バイトまでの文字列はそのまま・250バイトを超えたら...
        http://anond.hatelabo.jp/20090326135358
        確かにそんな気はする。つか、前はほぼ固定なので、後250を取れば問題ない気がする。ただ、今後の事も考えて、ベターな方法を知っておこうかなと。
  - http://anond.hatelabo.jp/20090326123924
    適当にググる。がいくつかあったので羅列某所のハッシュテーブル実装のおまけ的ハッシュ値計算法 str.charCodeAt(0) + str.charCodeAt(str.length-1)(str.charCodeAt(0) + str.charCodeAt(str.length-1)) * str.length...