2018年12月25日から2020年10月20日までの間、ブクログのユーザーページにおいて、ユーザーのメールアドレスが誰でも閲覧できる状態にありました。
2020年10月20日時点でこの問題は修正済みでしたが、ウェブアーカイブサービスにキャッシュが残っている場合があるので、その対応についてブクログに問い合わせをしました。
問題の詳細
この問題について、詳しくはブクログが公開しているお知らせを参照してください。
Wayback Machineにキャッシュが残っていた
僕自身ブクログで本棚を公開しているため、被害者の一人でした。
僕が気づいたときには既に修正済みでしたが、Wayback Machineには問題があった期間のキャッシュが残っていました。
そして、そのHTMLには僕のメールアドレスががっつり載っていたのです。
ブクログに問い合わせをした
2020年10月22日、次のような文面でブクログに問い合わせをしました。
本棚ページのソースコード上にメールアドレスが認識される状態だった件について、サービスの愛用者として非常に残念に思います(エンジニアとしては身につまされる思いでもありますが)。 さて、現在この問題は修正されているようですが、ウェブアーカイブサービスの一つであるWayback Machine上に過去の私の本棚ページがキャッシュされており、そのHTMLに私のメールアドレスが含まれることを確認しました。 以下のページははその一例です。 https://web.archive.org/web/20200424132403/https://booklog.jp/users/munierujp 他のユーザーにおいても、また他のウェブアーカイブサービス(archive.is、ウェブ魚拓など)においても同様のケースはあるかと思います。 メールアドレスが依然として公開状態にあるのは問題なので、削除してもらいたいところです。 しかしながら、少なくともWayback Machineの場合はウェブサイトと同じドメインのメールアドレスからメールを送るなどしてウェブサイトの所有者であることを証明する必要があり、一ユーザーにすぎない私ではどうしようもありません。 サービス提供者の責任として、これらのウェブアーカイブサービスの運営者に対してキャッシュを削除するように動いていただけないでしょうか? ご検討のほどよろしくお願いいたします。
翌日、丁寧なお詫びとともに「現在削除申請中である」といった旨の返信が届きました。
Wayback Machineからキャッシュが消えた
その後はブクログからのアナウンス待ちだったのですが、先日ふとこの件を思い出し、Wayback Machineを確認しました。
すると、次のようなメッセージが表示されました。
This URL has been excluded from the Wayback Machine.
色々とURLを変えて試してみたところ、どうやらbooklog.jp
ドメイン(サブドメインを含む)のウェブページはすべて、キャッシュが非公開になっているようです。
ユーザーページだけ、もっと言えば問題のあった期間のキャッシュのみを非公開にすればいいのではないかと思うのですが、Wayback Machine側の仕様なのかもしれません。
2020年10月26日には対応済みだった模様
僕がWayback Machine上でキャッシュが非公開になっているのを確認したのは2020年12月1日のことでしたが、少なくとも2020年10月26日には既に対応済みだったようです。
https://t.co/U9LKUC9UgJ
— mala (@bulkneets) 2020年10月26日
ブクログのwebarchive、事故公表時点で残っていたので22日に連絡して23日夜に対応中の返事。25日にwebarchiveが停電で障害起きてて正確な時刻不明だが今日の昼には消えてるのを確認。残念ながら全期間見れなくなっているhttps://t.co/jGamKU2C10https://t.co/Y02UuIN2sK
おわりに
対応したならしたで、ちゃんとアナウンスしてくれ〜!