文脈が理解できるデータベース
Dr. Kiyoki清木康(きよき やすし)慶応大学環境情報学部教授

 1956年生まれ。83年慶大大学院博士課程修了。工学博士。同年日本電信電話公社入社。84年筑波大学講師。98年4月から現職。研究テーマは分散型データベース・システム、マルチデータベース・システムなど。著書に「情報処理ハンドブック」(共著)、「知的コンピュータシステム事典」(共著)などがある。



BIT BY BIT(以下BBB) 先生はデータベースの研究で世界の最先端にいらっしゃいますが、その研究の一端を紹介して下さい。

清木 現在、二つの研究プロジェクトを進めています。一つは状況とか、文脈が理解でき、明るい、暗いなどの形容詞で画像や音楽まで検索できるデータベースです。現在のデータベースでは、情報に行き着くための手段は大きく2通りあります。情報のパターンがわかっていると情報に行き着くことができる「パターンマッチング」と、その情報の居場所がわかれば行き着ける「アドレスマッチング」です。ですが、これらは、データベースに詳しい人なら使えるでしょうが、一般の人にはとても使いにくい方式です。「楽しい」をキーワードに検索しても、「明るい」とか「ハッピー」、「幸福感」などは関係あるはずなのに、パターンが合わないので出てきませんよね。

 私が目指しているのは、パターンもアドレスもわからない状況で、言葉によって相関が強い情報を獲得するシステムを提案しています。たとえば「悲しい」、「明るい」、「幸福な」などの感性を表すキーワードを用いて検索すると、それらと相関の強い情報をダイナミックに抽出する「感性情報データベース」がそれです。これですと言葉の意味を解釈して近いものを選んでくれるので、利用者は自分の好きなキーワードで検索できる、とてもユーザーフレンドリーなものです。

BBB もう少し具体的に説明して下さい。

清木 今のデータベース検索では文脈を理解する概念がないんです。そもそもコンピューターは文脈がわかりません。でも言葉の意味を特定するには文脈と状況がわからないといけません。たとえば、単に「ブルー」だけだと、意味する範囲が大きすぎ、何を検索していいのかわからない。これにもう一つの単語、たとえば赤とか黄色が加わると信号という意味が出てくる。また、クリスマスという言葉と結合すれば「ブルー・クリスマス」となり、寂しいという感情が出てくる。現に人間は一つの情報が入ると意味の近い単語を瞬時に引き出すことができるすごい能力があります。

 ものとものの間の近さ、言葉と言葉の関係、メディア情報とメディア情報の関係は、文脈によってダイナミックに決まるんです。二つのオブジェクトの間にはほぼ無限の関係があり、その二つの関係が決まるのは文脈が与えられた時だけである。だから文脈を計算して二つのオブジェクトの間の関係をベクトル空間上の距離として計算する仕組みを作りました。

 たとえば、この空間の中に、悲しくて暗い感じの絵がほしいという「文脈」を与えると、「悲しい」と「暗い」というキーワードから、どの情報が近いかを計算し、それに対応した部分空間が選ばれ、さらに相関の近い順に並べることができます。そこで一番相関の強いものを選べば、一番印象の近い絵や音楽が選ばれる。扱う情報は、画像でも音声でも可能で、言葉から画像を選んだり、画像から音楽を選んだりもできます。

 すでに試作した名画のデータベースは、利用者が、「北斎の絵で、その中で、ストロングでパワフルな絵を出してほしい」という要求をすると、それにあったストロングでパワフルな順にソートされてでてくる。これは、それぞれの絵を3語の形容詞で表現して登録していて、関係する絵の相関量を計算して並べて出してくる。



トップ 次ページ


Yomiuri Bit by Bit