情報の検索力を上げよう/中村 久吉

 普段何気なく使っているインターネットの検索エンジンも、使い方次第で情報
検索の精度に大きな違いが出てきます。今回は、インターネットや有料の商用デ
ータベースを上手に使いこなす基本を整理しておこうと思います。知らなくても
使えるけれど、知っていると必要な情報を探す際の時間や作業の無駄を大幅に削
減して、効率よく情報を取り出すことができます。

 例題として、次の調査テーマを設定してみましょう。
機械業界における東南アジアでの現地生産や企業買収に関する記事等を探し出し
たい、ただしフィリピンについては必要ない、と言うものです。

この場合の手順は、先ず「現地生産」や「企業買収」に関する情報を探します。
次に、その中から「機械」業界に関する情報だけに絞り、更に「東南アジア」の
地域に属するものだけに絞り、最後に「フィリピン」に付いての情報を振るい落
とせば良いわけです。この作業を演算と言っていますが、数学のように難しいも
のではなく、使うのは足し算(OR演算)、掛け算(AND演算)、そして引き算(NOT演
算)の3種類しかありません。この手順を式に表すと、以下のようになります。

(現地生産 OR 企業買収) AND 機械 AND 東南アジア NOT フィリピン

商用の記事情報データベースでは、このような検索式をキーワード欄に記入する
こともありますが、GoogleやYahoo等インターネットの検索エンジンでは、もっ
と簡便に使えるようになっています。これらの検索エンジンでは、「検索オプシ
ョン」とか「検索設定」の文字列をクリックすると上のような演算ができる頁が
開きます。そこでは、足し算(OR演算)は「いずれかの語を含む」、掛け算(AND
演算)は「全ての語を含む」、引き算(NOT演算)は「含めない」と表現されていま
す。ぜひ、この詳細検索のできる頁を開いて利用してみてください。

また、演算の順序は、通常、足し算→掛け算→引き算の順に行うのが定石でもあ
ります。つまり、必要そうな情報を足し算で広く集めておき、次に必要なものだ
けに掛け算で絞込み、最後に不要なものを引き算で振い落すのが良いのです。こ
れらの演算を一気に行う場合の優先順位は、一般に引き算が最優先され、次いで
掛け算、最後が足し算の順になりますので、注意してください。
演算では、留意すべきことが一つあります。引き算は、むやみに使わない方が良
いと言うことです。上の例では、「フィリピン」の他に「マレーシア」や「シン
ガポール」についての情報を同一の記事・頁内に記述しているケースがあり、引
き算をすると、この情報は失われてしまうことになるからです。

ところで、この手順で演算すれば、上の例題テーマに対する解は的確に得られる
のでしょうか? 残念ながら、現在の技術レベルでは、的確な解に混じって「ノ
イズ」と言っているゴミ情報が紛れ込んでいます。このノイズは絞込み(掛け算)
をする際に発生します。つまり、一つの完結した記事・情報の中に、指定した複
数のキーワードの全てが現れていれば、それで掛け算(AND演算=重複集合)が
成立したことにしているのです。ここに問題があって、実際は掛け算が成立しな
いことも結構あるのです。ですから、情報検索の精度を上げるには、この絞込み
(掛け算)の際に用いるキーワードがポイントになります。商用の記事情報デー
タベースの中には、この問題の発生を軽減する機能を持っているサービスもあり
ますが、インターネット上の検索では現状で無理です。

 次に、情報検索するときに入れるキーワードから考えてみましょう。キーワー
ドは大きく自由語と統制語に分けられます。自由語というのは、文字どおり皆さ
んが自由に発想した言葉で検索する方式です。もちろん、インターネットを初め
として商用の記事情報データベースの殆んどが、この方法を採用しています。統
制語は専門情報を取り扱うデータベースが採用していて、キーワード間の関係付
けがされ、言葉の体系を持っています。特に親子関係が重要で上のテーマでは、
「東南アジア」に対して「フィリピン」「インドネシア」「シンガポール」「マ
レーシア」・・等が子供のキーワードになり、「バリ島」は「インドネシア」の
子で、「東南アジア」の孫になります。一般に統制語をサポートしているデータ
ベースでは、親キーワードを指定しておけば、子や孫のキーワードは自動的にサ
ポートされますので入れる必要がありません。これは大きなメリットです。自由
語だけですと、親キーワードのほかに、子や孫のキーワードを羅列して、足し算
(OR演算)で繋いでおかなければなりません。

このように統制されたキーワードの体系を「シソーラス」と言い、通常は数年毎
にシソーラスの改訂を実施して、最新状態を保つ努力がなされています。便利な
統制語ですが、インターネットや新聞・雑誌等の一般的な記事情報データベース
はサポートしていず、一般情報では日本経済新聞社の新聞記事データベースのみ
が、唯一統制語をサポートしたサービスです。もちろん、科学技術文献等の専門
的なデータベースでは、統制語をサポートしているのが普通です。

 インターネットの普及によって、誰もが情報の受発信をできる時代になり氾濫
する情報の中から必要な情報だけを抽出する情報検索スキルは、ますます重要に
なってくると思われます。本稿に述べたことをシッカリと憶えているだけでも、
情報検索の仕方が変わってくるのではないでしょうか。


■執筆者プロフィール

中村久吉(なかむらひさよし) eri@nakamura.email.ne.jp
戦略の立案から、組織・人材・情報システムの最適化、及び情報リテラシ教育、
個人情報保護対策、プライバシーマーク認証取得、ISMS(情報セキュリ
ティ・マネジメントシステム)構築まで、一貫してサポートします。
ITコーディネータ、中小企業診断士、ISMS主任審査員、社会保険労務士