Wayback Machineの過去ログを消してみた

Internet ArchiveWayback Machineをご存知でしょうか。
ぐぐってみるとアドレスの隣に『キャッシュ』と書いてあり、過去の状態を見れる時がありますよね。
あれを数年分保存しているサイトと考えていただくと分かりやすいです。
詳しくはWikipediaをどうぞ。
数年分の何が怖いかというと、10年前ぐらいのものでも平気で残っていたりするんです。
10年前と言うとtok2、infoseek、coolなどの無料レンタルサーバーが強かった時代ぐらいです。
もっと前ですかね。

当時(または現在)の自分のウェブサイトアドレスを覚えている方は
これをアドレスバーに入力してみてください。
http://wayback.archive.org/web/*/あなたのURL/*
例)http://wayback.archive.org/web/*/http://www.yahoo.co.jp/*
※前後の*は必要です
何も出なかった方はおめでとうございます。
以下は、何かが出て胸が痛くなった方向けの文章です。

自己紹介と日記以外が永久工事中、†でコンテンツ名を囲ってある、壺型オサレポエムがある……
忘れていたウェブ黒歴史が出てきたのではないでしょうか。
まさにそれに該当した自分が、削除に至った経緯を書いていきますので、参考にどうぞ。

相手はアメリカ拠点のサイトですので、やりとりは全て英語になります。
調べると「適当な英語でも大丈夫!」「ごねたら消してくれた!」と書いている方もいたのですが、
そう簡単にはいきませんでした。

User-agent: ia_archiver
Disallow: /
と書いたrobots.txtを用意すれば自動で対応してくれるようですが、対応されなかった場合で、
消したいサイトを現在運営している、または当時のメールアドレスを使えるなどして
同一人物だと身分証明ができる場合はこちらの方法で。

宛先:info@archive.org
Hello.
I'd like you to delete the following data from your archive:(消して欲しいURLリスト)http://wayback.archive.org/web/*/あなたのURL/*
 
My mail address is displayed on the following page:(身分証明がある場所)
http://wayback.archive.org/web/*/あなたのURL/メールアドレスが書いている場所*
 
thank you

以上のメールをそのメールアドレスから送りましょう。
サイトをいじれるようであれば、無断転載禁止の旨を英語で書き加え、それもメールに足しましょう。

自分がてこずった理由

・サイトが複数ある
・レンタル掲示板や日記もある
・既に閉鎖しているサイトもある(むしろそれが多い)
・各サイト運営当時と今ではHNとメールアドレスなどが違う
という問題があり、上記のやり方ではできませんでした。

消したいサイト、掲示板や日記などの外部サービスがある場合は全て探します。
現在とHNやメールアドレスが違い、本人証明ができないのであれば、
アカウントが同一でないか探します。
たとえば、現在のメールアドレスがyamada@mail~の場合、
http://***/yamadaのサイトは自分のものだと証明できます。
レンタル日記がhttp:/***/taroの場合、http://***/yamadaからtaro日記がリンクされていないか探します。
見つかったら「yamadaサイトのこのページからtaro日記にリンクが繋がっている」と英語で書きましょう。

サイトアカウントもメールアカウントもHNも変わって別人として移転している場合は、
同じ作品(コンテンツ)がないか探しましょう。
自己紹介ページに誕生日などが書いてあると証明に使えます。

そうやって全てのサイトの関連をどうにか見つけましょう。
どうやっても見つからなかった場合は消してもらえないと思ってください。


自分で英文を書けない方は翻訳はグーグル先生に任せましょう。
日本語から英語に訳し、それをまた日本語に戻してあまりに酷い違いがなければだいたいは伝わります。
冒頭に「I can't speak English(わたしは英語が話せません)」と
書いておくとなんとなくいいかもしれません。
※本当は「I don't speak English」が正解ですが、英語が話せない事をアピールしたい時はcan'tでいいと思います(主観

本人証明ができると今度はHNではない個人情報を尋ねてきますが、
それらしい名前(tanaka hanako)などで大丈夫です。

削除後、robots.txtを置けるサイトであるならばそれで対策してください。
対策できない場合は(過去のサイトを削除した場合であれば大丈夫だと思いますが)
I also request you to make sure that, from now on, the internet documents in my website should not be gathered nor made available in your collectoin or Wayback Machine.
(二度と俺に近寄るんじゃねえ)
と足しておきましょう。

番外編

他人のサイト(掲示板・日記など含む)に自分の個人情報が書いてある場合
英語でそう言えば、削除済みの過去のサイトでもアーカイブから消してもらえます。

これはこれで消せましたが、一度webに出したものは何処かの誰かによって
ローカル保存されているものと考えましょうね。
自分の状況がややこしかったので充分に伝わっていないと思いますが、
相手は機械ではなく人間が管理しているものなのできちんとやり取りすれば消せると思います。


参考
http://www.archive.org/about/faqs.php
http://daikin.ddo.jp/2006/01/19_googleとInternet Archiveのキャッシュ削除.html
http://web1.nazca.co.jp/hp/none/n/04-05.html


02/08 人間の愚かさを教えてくれる『フランケンシュタインの誘惑』が好きすぎる

はじめてこのサイトに来た方への案内所はこちら

類似記事

Copy&Paste


本文のコピペやスクショはしないでください