@410

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

教えて!gooのページを全部アーカイブ保存していた方がよかったですか?

今日の11時に、教えて!gooのサービスが終了しました。

Internet Archiveなどのアーカイブサイトには、断片的にしか保存されていないようですが、
25年分全ての質問のページがInternet Archiveに保存されて欲しかったでしょうか?


自分は、その全ページを保存するアイデアや構想はあったのですが、

たとえ、教えて!gooをIAに全て保存しても需要はあるのだろうか? と
アーカイブとして残す必要性や価値に疑念が浮かぶようになり、

保存作業を直前にやめてしまいました。


もし保存してアーカイブにアクセスが多からずあったとしても一過性程度で死蔵してしまうのでは? と思ったりして、

全ページを保存すると数十GBもIAに占有してしまう可能性があって、中途半端な保存失敗する可能性や負担も考えると全ページ保存しない方が機会費用的にマシなのでは? と思いました。


「教えて!goo」のようなサイトだと、全ページをアーカイブする価値や意義があったと思いますか?

また、どういうサイトだと、サイト全体をIAに保存するのに相応しいと思いますか?

0 likes

7Answer

だいいちInternet Archiveでなければならない理由(というか魚拓の需要)というのは情報の紛失防止だけではなく,内容の変更の有無を第三者視点で検証しなければならない場合というのも多いです.著名人の個人ブログやTwitterの投稿だったり怪しい中華系の企業サイトとか…

数十年単位の文化的調査をするためならともかく,基本2次以降情報しか載らない掲示板やQ&Aサイトの情報,まして頻繁に書き換わる代物でもなしに,保全しても何に活用すんねんというのが現実的な評価だとは思います.

2Like

Comments

  1. 自分としても学術的価値が全く無いとは言いたくないですが,機会費用的にマシなのでは?などと考慮しなければならないユースケースを想定される時点で需要を絞ってしまいますので,こういうのはある種大義のために動くようなものであります.
    直接書いてある情報を使う訳じゃないのがミソなのです.10年前のスマホの使い方なんか漁ってもしょうがないですし.
    後世の研究者たちも何も教えてgooのアーカイブだけを見るわけじゃありませんのでね.

  2. ここからは偏見混じりで書くんですが,ああいうサイトでは宿題の答えとか,当時でさえggってすぐ出るような事を質問する人は結構いました.要するに調べ物できない人が回答者の乱文を鵜呑みにするような性質があったんですね.こうしたページは当然ながら単純な情報ソースとしての価値を落としてしまいますので,後から参考にすることは難しくなります.
    その事象全体の側面に着目する意味では,学術的価値はさらに高まるかもしれません.

Internet Archive のミッションは研究者や歴史家に向けて現代社会のデジタルアーティファクトを保存したライブラリを作ることだそうです1。過去の文明社会は遺物によって記憶を伝えてきたのだからデジタルデータも将来に遺すべきだ、という意味合いで言っているようですから、保存するかどうかを今役に立つかどうかで判断するのはナンセンスでしょう。

全ページを保存すると数十GBもIAに占有してしまう可能性

これについていえば、 Internet Archive は現在約9460億ページを保存しているようです。2016年時点では約2730億ページだった2ことを考えると、大雑把に平均すれば1日あたり2億ページを保存しているわけで、すべての質問(何件か知りませんが多くても数千万ページでしょう)を保存したとしても誤差程度にしかならないと思います。それだけあるとクロールが間に合わないことがむしろ問題になったはずですが。

  1. https://help.archive.org/help/wayback-machine-general-information/

  2. なお2730億ページの保存には15ペタバイトのストレージを消費したようです https://blog.archive.org/2016/10/23/defining-web-pages-web-sites-and-web-captures/

2Like

どんな知識がどのように役立つか事前にわかるなら苦労しません。

たとえば電気の歴史を見ると雷・静電気・磁力の断片的な研究は紀元前から有りましたが動力として生活に役立てるようになったのは十九世紀に入ってからです。 逆に言えば基礎研究をやっていた人はそれがどのように役立つものであるか知りませんでした。

文化・習慣の記録として見るなら日常こそが重要です。 江戸時代の庶民のひとりが食べた物を毎日記録していたのが出て来て学者の注目をあびたことがあるそうです。 当時としては馬鹿馬鹿しい変人の趣味として見られたでしょうが、人々が意識的に記録するのは事件・事故・発明・発見などであり当たり前の日常を残した記録というのは本当に貴重なのです。

教えて!goo の回答が知識としてほとんど無意味だったとしても、どの時代に誰がどんな疑問をもったのかというのは歴史の記録として遠い未来に意味を持つことがあるのかもしれません。 しかし、それは今の私たちにはわからないことです。

2Like

むしろそのサービスの全ての投稿をアーカイブしたいと考えた理由は何ですか?
どこに需要、必要性、価値を感じたんですか?

個人的にはアーカイブする必要性は全くないと思います。
真に有益な情報は他に場所へどんどん転載され、インターネットの何処かに残り続けます。
何処かにアーカイブを残したとしてもそれは通常の検索には引っかからず、誰も見ないデータになります。
それを作る意味は全くないと思います。

0Like

今日の11時に、教えて!gooのサービスが終了しました。

そうなんですかー。全然知りませんでしたー。
QAサイト、特に古いのQA情報がどこまで有用なのか結構疑問です。

また、どういうサイトだと、サイト全体をIAに保存するのに相応しいと思いますか?

少なくとも有名なウェブサイトで「ネット民に惜しまれつつ終了」みたいなのがないと、あとでアーカイブ見て思い出話するとかにはならない気はします。
flashやバナーを集めたサイトのように、個々でグっと来るものもあると思いますし、例えば阿部寛のホームページなども、もしなくなるのであれば、残されていると思い出話ができるかもしれません。

0Like

Comments

  1. 皆さんのコメントを見ていると、なるほどごもっとも。
    ただ私自身がいるかいらないかとなると、やっぱりいらないってなるかな。

一点だけ気になることですが……
そのサイトの内容の著作権的なものはどこが所持しているでしょうか?
facebookは最初は大学の名簿から収集し、ClaudeのAtlantic社はデータを無断学習させているので、その点で批判対象になってます。
規約で権利放棄とか明記されてないサイトであれば、そのアーカイブを公開するときに何か言われるか、最悪、サイトから訴訟を受けるリスクもあるかと。
---
2025年9月5日、Anthropic社は著作権侵害訴訟で15億ドル(約2200億円)の和解金支払いに合意
https://authorsguild.org/news/what-authors-need-to-know-about-the-anthropic-settlement/

大丈夫ならやって置いた方がよかったかもしれませんね。

0Like

こういう事をやる人ってホントに少ないんだよね。好事家じゃないとやらない
flushの方がよほど文化的価値があったと思うけど、日本人は碌に保存とかしないよな
白人はよくやるのに

0Like

Your answer might help someone💌