ウェブアーカイブ

主なウェブアーカイブサービス 備考 参考リンク

ウェブアーカイブとは、ウェブページを手動または自動で収集し、保存するものである。

主なウェブアーカイブサービス


archive.today

完全手動制で、公開されているウェブページのほとんどは保存されるが、動画やPDFなど保存されないものもある。保存されたページは動的要素が無効化されているため、安全にページを見ることができる。このサイトの強みは余程の事がない限り取得したページが削除されない事、また送信元のIPアドレスを開示することがない事である。但し取得した際のIPアドレスはarchive.today側に伝わるため必要に応じてTorやProxyを利用すること。ChromeやFirefox、Edgeを使用しているのであれば拡張機能を使うことで効率良く魚拓の蒐集、確認ができる。大量に魚拓を取る必要がある場合は半ば必須。

Wayback machine

ウェブアーカイブサービスでは最も知名度が高い。保存されたページは動的要素も機能するため、Wayback Machineで保存したほうがarchive.todayよりも再現性が高いことがある。自動でクロールして保存しているが、手動で登録することもできる。著作権などの関係でページを削除してしまうこともあるため、Wayback Machineで保存されたページをさらにarchive.todayで保存するという過程が必要な場合がある。Torを利用して保存することも可能。

ウェブ魚拓

日本の会社が行っているサービスのため、削除要請や開示請求にあっさりと応じる。しかしTorを利用して保存する、他のウェブアーカイブサービスでさらに保存するという方法である程度は対策可能。archive.todayやWayback Machineがアクセス禁止されているページを保存するときに有用。

備考


X(旧Twitter)のポストの保存について

Xのポストはarchive.todayとウェブ魚拓で手動保存することができる(Wayback Machineで保存しようとしてもうまくいかないことが多い)。ポストのurlは
https://x.com/(スクリーンネーム)/status/(タイムスタンプ)
という形になっているがarchive.todayでは
https://x.com/i/status/(タイムスタンプ)
という形にすると返信を含めて保存することができる。
但しポストの数が多かったり、センシティブなメディアが含まれていたりする場合、完全に保存できないことがある。そのため必要に応じてnitterなどを利用するとよい。

Wayback Machineでは現在https://twitter.com/(スクリーンネーム)/status/(タイムスタンプ)の形でJSONデータだけ自動収集している場合が多いので探せば保存されたものが見つかる可能性がある。

参考リンク


掲示板

1: 名無し先輩 2025/03/28 00:28

有能

2: 名無し先輩 2025/03/28 07:04

有用な情報助かる

書き込む