Sep.07, 2006

ぐぐる先生えらい!

[Diary]

早速ニュースになっている、Googleの新サービス、News Archive Search。過去200年までの新聞を検索する事ができるという触れ込み。ただ、日本語版はないようで、USなどに切り替えないとメニューが出ない。

では、昔のニュースを探してみよう。ウチならば格好のネタがある。験しに"kipton collision 1891"と入れてみると…おお、オハイオの地方紙がいっぱい。例の鉄道事故の記事がいろいろ出てくるではないか。今度色々読んでみよう。

サービス自体は新聞のアーカイブ・サービスとのリンクでGoogleのオリジナルではないけれど、それはGoogleニュースも同じことで、とにかく辿る術ができたことに意義がある。

もっとも、問題もないわけではない。テキストはOCRによるものなんだが、100年以上も前の新聞ともなると紙面の状態も良くないようで、誤認識が結構入っているので注意が必要。

…とはいえ、これが日本の新聞だったら漢字カナ交じり文のOCRになるわけで、印字品質を考えるとその困難ぶりは想像に余る。人間様の認識能力は偉大だなぁ。

しかし、日本語版の構築にはもう一つのカベがあるような気がする。既得権益ガッチガチの日本の新聞社様が、Googleに対してアーカイブを解放するか?といったら…どうもねぇ。

明治から大東亜戦争まで、当時の資料に簡単にアクセスできるようになったら面白いと思うのだが。

何か気になる歴史上のイベントがあったら(今のところ欧米限定っぽいけど)、こういうやり方でぐぐる先生に訊いてみるのもまた一興、と。

Here are 0 Comments & 0 Trackbacks