2020-08-04

増田検索の遅さ

以前にもこの機能ヤバい遅さは言及されていたのだが、時系列検索をしたくなったときに改めて気になった。

そもそも全文検索ではないのだ。全文検索は難しい。探索木が素人には無限に見える程に広がる。試験的なサービスRDBMSLIKE 検索をさせているサービスもあった。だから、てっきりそういうインデックスが効かず(前方一致なら効く)メモリを大量に消費する処理だから遅いんだと思っていた。

でも、増田検索ってキーワード検索なんですよね…。はてなキーワードは三十数万件らしいので、 LIKE でも全然即答できる。

これもしかして、 {マッチしたはてなキーワード} (120) とかの (120) 部分、つまり該当キーワード言及する日記から count するために遅いのでは。いやあったら良いこともあるけれど、検索機能することよりも大事ではないよね。ついでにいうと count としても遅いので、 NULL 値を考慮しないならカラム名指定せず選択された行の数を返す count(*) が早いよ。

あー、チューニングさせてくれ…。無理だとしても、増田検索は負荷で遅くなっているのではないと表明してくれ。検索するたびに寿命が縮む。いや、 AnonymousDiary の寿命が縮む思いだ。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん