http://q.hatena.ne.jp/1344478346
に一部書いたが、13年前からコツコツと作っていたホームページのうち、
半分のサイトを、Hoopsという無料HPサービスで構築していた。
(もう半分はGeocitiesで構築)
2010年に楽天は突然無料HPサービス(iswebライト)の停止を宣言した。
※因みに、間もなく有料サービスiswebまでも停止を宣言する。
ウェブアーカイブに対する楽天三木谷の無理解ぶりには唖然とするし、
この一件のせいで、自分の中で、楽天は「嫌いな企業ワースト3」に入ってしまっている。
自サイト常連から、「早く復旧してくれ」の要望が多かったのだが、
ファイル容量40MB近くなので、都度都度アップするのは非常に困難。
そこで思いついた「迷案」が、
「インターネットアーカイブ ウェイバックマシンに保管されているキャッシュページへの
リンクを掲載することで、消失ページの代替とする」ことだった。
しかし、この迷案は、結局名案じゃなく迷案に留まった。
※結局、残り80~90%については、
自宅PCのキャッシュを「はてなダイアリー」にアップせざるを得なく、今日時点で半分程度の復旧率。
ネットを見渡しても、
「インターネットアーカイブが、どれ位の割合でキャッシュを保管しているのか?」という
なので当初、自分は「キャッシュをほぼ100%保管しているだろう」と思い込んでいたのだが、
どうやらそうではないらしい。
1,000頁近くのサイトについて、都度都度「インターネットアーカイブに保管されているか?」を
実地検証した人は、恐らく日本では自分しかいないのではないか?
折角なので、「インターネットアーカイブはどういうページを保管しているか?」等について、
将来、他の人の参考になるように、傾向をレポートしておく。
2.インターネットアーカイブのキャッシュは2001年と2004年に多い
これは自分のページだけかもしれないが、この頃のキャッシュは結構ヒットする。
逆に言えば、2005年にアップしたページの保存率は低い。
感覚論だが、2004年以前にアップされたページのキャッシュ保管率は70~80%、
2005年以降にアップされたページのキャッシュ保管率は5~10%程度である。
一説には、
「2009年以降については、アーカイブ財団側の作業が間に合ってないため、キャッシュ公開に時間がかかるから」
とか
「著作権の問題があるので、ここ数年のキャッシュについては、アーカイブ財団側が意図的に公開を遅らせている」
との情報があるが、真偽は不明。
少なくとも、自分のHPを見る限り、2009年以降でキャッシュされたケースはレア
(保管率1~2%程度?)
「鉄コの部屋」という鉄道コラムサイトは比較的保存されているが、
増田がどれほどの知識あって書いてるのかも、文旨もさっぱり解らないのだが Internet Archiveはインターネットの歴史を蓄積研究するための物で 別段、全部を蓄積する義務あるなんてもん...
お前のいちゃもんをつける事しか考えていないそのアホな文章をなんとかしてくれ。