リンクが切れていた場合、webarchive から過去の文章を抜き出し、
キーワードを抽出、Google検索、過去の文章と照らしあわせることで最もありえそうな文章を持つページを
新URLとして登録する。
ローカルにインストールして自分のウェブページ用に使用するのもいいが、
Firefox 拡張かなにかで、他人のろくにメンテナンスされていないウェブページを見つけてしまった時に使用したい。
ってことでよろしく。とりあえずは、キーワードをうまく抜き出せば、ぐぐって一番上を登録でも大抵いけそうな気はする。
Permalink | 記事への反応(1) | 04:39
ツイートシェア
ローカルに持ってるよりもDBだけ共有したほうがいいだろう。 仮にサイト名を「ネクロマ」とする。 1、ブラウザがユーザの参照しようとしているサイトのリンク切れを検知 2、ブラウ...
それこそSBMで。 抽出してあるキーワードとはてな検索で。 ま、それだけだと精度が保てないだろうけど。