410
@410

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

NAVERまとめやGeoCitiesのウェブアーカイブは誰が行っていたのでしょうか?

2020年9月30日にNAVERまとめの終了ですが、インターネットアーカイブで2020年9月22日頃(日本時間23日)に、NAVERまとめの記事ページが保存されているようです。

どれぐらいの規模が保存されたかは確認していませんが、憶測ですがどうやら一通りの記事は網羅されて保存されている可能性があります。

恐らくbotを動かしてページ保存されているのだと思われますが、誰によって1保存活動が行われていたのでしょうか?

関連して、日本のYahoo!ジオシティーズのサービス終了の際も、横断されるようにジオシティーズのサイトがインターネットアーカイブに保存されていました。

こういう活動はやっぱりコンピュータに精通した人が独りでひっそりと身元を明かさずに行っている(行った)のでしょうか。


  1. あるいは、何処どこで 

0

2Answer

完全に自動だと思いますよ。

ウェブをクロールし、一般にアクセスできるWorld Wide Webページの全て、Gopherヒエラルキー、ネットニュース(Usenet)掲示板システム、ダウンロード可能なソフトウェアを収集するために開発されたソフトウェアが「クローラー」である[13]。「クローラー」によって収集された情報はインターネット上にある情報が全て含まれているわけではなく公開者によって制限されているかアクセスできないデータベースに保存されているデータがある。部分的にキャッシュされたウェブサイトの矛盾を解決するために、2005年にインターネットアーカイブがArchive-It.orgという機関やコンテンツ制作者がデジタルコンテンツコレクションを収集して保存しデジタルアーカイブを作成するシステムを開発した[14]。

これとは異なり、人間のアクションで保存しているのはいわゆるweb魚拓と呼ばれるものです。
https://ja.wikipedia.org/wiki/ウェブ魚拓

1Like

Comments

  1. @410

    Questioner

    「完全に自動」ということは、クローラーのようなbotによってページ保存が行われているということですか?
    そのbotの作者またはbotの実行は誰によるものなのでしょうか?

    botの活動がNAVERまとめ終了の公式アナウンスの前から活動していたり、終了の公式アナウンスとは無関係にNAVERまとめ終了間近で偶然保存対象になったりした場合ならわからなくもないのですが。どうでしょう。

Naverまとめ

こちらのページに9/22付のアーカイブがあるので記載されてる3名の方々がアーカイブしたのでしょう

GeoCitiesJapan

こちらの記事でプロジェクトリーダーの方々の名前が出ています。国内ではこちらで活動されている方もいました。恐らく彼らがアーカイブしたのでしょう。

全サイトをクローラが自動で収集するのは無理があるように思うので、サイトアドレスを用意するところはたぶん人の手でやっているのではないかなぁと。クローラについてはこちらに記事がありますので参考に。

1Like

Comments

  1. @410

    Questioner

    国内のサービスの事でも海外の人による保存プロジェクトが存在していたのですね知りませんでした。

    GeoCitiesの事も知れてようやく腑に落ちました。ありがとうございました。

Your answer might help someone💌