ローカルに持ってるよりもDBだけ共有したほうがいいだろう。
仮にサイト名を「ネクロマ」とする。
1、ブラウザがユーザの参照しようとしているサイトのリンク切れを検知
2、ブラウザからネクロマに報告が飛ぶ
3、ネクロマでは検索を実行し、検索エンジンのキャッシュから当該ページを再生する。
4、ブラウザに再生されたページを返す。
共有することのいい点は、多くの人が利用することにより
サイトが消えた早い時期にキャッシュを参照できること。
つまり検索エンジンのキャッシュが消えるまえに記録を残すことができる。
ただWEB魚拓がぶつかっているような訴訟問題みたいなのに巻き込まれる可能性もあったりなかったり。
Permalink | 記事への反応(1) | 07:35
ツイートシェア
リンクが切れていた場合、webarchive から過去の文章を抜き出し、 キーワードを抽出、Google検索、過去の文章と照らしあわせることで最もありえそうな文章を持つページを 新URLとして登録...
ローカルに持ってるよりもDBだけ共有したほうがいいだろう。 仮にサイト名を「ネクロマ」とする。 1、ブラウザがユーザの参照しようとしているサイトのリンク切れを検知 2、ブラウ...
それこそSBMで。 抽出してあるキーワードとはてな検索で。 ま、それだけだと精度が保てないだろうけど。