The Internet Archive
Wayback Machine.




Advanced...
 ←でリンクされているのは The Internet Archive Wayback Machine、いわゆるインターネットアーカイブ(あるいはアーカイブとも略される)サイトです。
 これは非営利団体「インターネット・アーカイブ」と米アレクサ・インターネット社が提供しているサービスで、WEB上からデータが消えて閲覧できなくなったサイトのバックアップデータを検索したり閲覧したりすることが出来ます。

 ※左の入力欄からも実行できるようにしてあります。
 ※使い方を把握している人は、ここから実行してください。
 このシステムは世界中のWEBサイトを自動巡回して内容をバックアップしてありますので、ここに行けば、WEB上から消えて通常の手段では閲覧できなくなったサイトを閲覧することが出来るかもしれません。
 ただし、インターネット上のWEBサイトの数は膨大なため、全てのURLは監視できません。
 そのため、保存されていないドメインやURLも当然のことながら多数ありますので、必ず全てのサイトを閲覧できるというわけではありません。また、古いデータしかバックアップされていなかった場合などには、最近の(閉鎖/消滅直前の)データは閲覧できないことがあるほか、掲示板やBLOG、WIKIなどといったCGI等を利用した動的に内容が変化するURLの場合には内容が保存されていない場合がありますのでご注意ください。


使い方

 百聞は一見にしかずとも言いますし、このサイトの使い方は非常に簡単です。
 以下に、操作手順を書いてみますので一度試してみてください。

 まず、上記リンクからアーカイブのページを開きます。
 すると、以下のような画面が開くはずです。


 この画面が開いたら、次に赤丸の部分にあるテキストボックスにURLを入力します。
 ここには、WEB上から見れなくなったサイトのURLや、昔の姿を見てみたいサイトのURLなどを入れます。
 (例えば極楽門の昔の姿を見てみたい場合などには、"http://yukinozyo.ld.infoseek.co.jp/"のURLを入れます)
 URLの入力が済んだら、次に[Take Me Back]のボタンを押してみましょう。
 すると、そのURLのバックアップの履歴情報が表示されます。


 指定したURLがバックアップされている場合には上のような画面が表示されます。
 バックアップされたサイトの履歴情報は年代別に一覧表示されていて、右にいくほどに新しい履歴となります。
 上記の図では2004年〜2008年の間のバックアップデータが閲覧できることが分かります。



○ページがまともに表示されない場合

 このシステムはアジア圏の2byte文字を前提としていないシステムのため、バックアップデータを開くと文字化けを起こす場合があります。
 これはエンコード(どういった文字コードで表示するかの設定)が適切に設定されていない場合などに起こります。
 (日本語のページを開くと自動的にUnicodeに設定されて開かれるのが原因?)
 その場合にはMENUからエンコードを選び、そこの一覧に出てくる文字コードを[自動選択]あるいは[Shift-JIS]もしくは[EUC-JP]などに切り替えてみる事でまともに表示されるはずです。

○リンクが切れている場合

 開かれたWEBページはリンク先のページが存在しないことを前提としたリンクになるため、全てのリンクがWEBアーカイブ内へのURLへのリンクに変更されています。
 そのため、普通なら過去のデータを辿る形で開いていけるはずですが、データの状態によっては所々で元のページに戻れない場合などがあります。
 そういった場合には、リンク先のページの本来のURLをWEBアーカイブで開いてみることでデータを取得できる場合があります。

○圧縮ファイルが開けない場合

 InternetArchiveからダウンロードした圧縮ファイルは末尾が1byte削られている事が多いことで有名です。  そのような場合には、バイナリエディタなどでファイルを開いてファイルの末尾に「00」(16進数の0x00=1byteの空白データです)を書き加えることで正常なファイルになる場合があります。





関連リンクなど

WikipediaでInternetArchiveがどういったサイトなのかを調べてみる。

ネットサービス@2ch掲示板で、InternetArchiveの専用スレッドなどもあります。

今、この瞬間のスナップショットを保存しておきたい!そんなときにはWEB魚拓という別のサービスがあります。



inserted by FC2 system