区別のつきにくいデジタル形式の情報がWebや各種データベースにあふれ続けている。このためナレッジ・ワーカーにとっては、情報洪水を乗り切るための有効なツールが一層必要になってきた。
そこで開発されたのが、「毒をもって毒を制す」とばかり、デジタル情報のカオスにデジタルの力で立ち向かうツールである。このレポートでは、実用化または開発中の技術の4つの情報検索技術を取り上げる。
第一のカテゴライゼーション・ソフトウェアは、まず情報を読み所定のパラメータに従ってカテゴリーを示すタグをつける。ユーザーが関心のあるカテゴリーを指定すると、システムが該当する情報をピックアップする。第二のテキスト・マイニング技術も情報を読む点は同じだが、固定的なカテゴリーに分類するのではなく、情報同士の関連性を見出す点が特徴である。第三のデータベース検索技術は、フォーマットや構成が異なる分散化リレーショナル・データベースを横断して検索する技術である。第四のセマンティック・ウェブは、標準化された識別子を使って情報にタグをつけ、情報のカオス(現在のWebが正にそれである)に秩序をもたらす技術である。ただしこの技術は、現在まだ開発段階にとどまっている。
このレポートでは、デジタル情報の検索を容易にするための技術(上述のアプローチを含めて)を検
討し、使用目的や状況に応じたそれぞれの長所と有用性を比較する。
(11ページ)(著者:Marcelo Hoffmann)
|