| --> |
« 京都のうまい店 タイ料理 Thai Cafe Kati | トップページ | 泣き上戸の人と飲みたいのですが。 » 2006年12月28日人間の感性は2,000次元?先日、慶應SFCの清木先生が研究室に来られて、共同で行っているプロジェクトの打ち合わせをしました。 清木先生の研究室では感性に基づく検索というのを研究されていて、たとえば「暖かい音楽」と入力すると、音楽データベースの中から実際に暖かい感じの音楽を見つけてきてくれる。かなりよくできています。 これは清木先生が10年くらい前に提唱した意味の数学モデルというのが元になっているそうです。すなわち、あらゆる検索対象を2,000次元の意味空間にマッピングしておき、クエリからの距離が近いものを検索結果として返すという仕組み。 なぜ2,000次元かというと、元になっているデータがロングマンの英語辞書だそうで、これはすべての語を2,000個の基本語彙で定義することを試みている。もちろん、個々の基本語彙が意味的に直交しているという保証はないので、あらかじめ相関行列に対する固有ベクトルを求めておく。 意味の数学モデルでは基本語彙同士が定義の際に使われるという関係を相関行列とみなし、その固有ベクトルを意味素と定義しているようです。手法的には特異値分解を使うLSI(latent semantic indexing)に似ていますが、LSIは実行するたびに空間を求めるのに対し、清木先生の手法は辞書をもとに一回計算すればいいだけ。 実際にロングマンの辞書から作られた相関行列を固有値分解してみたところ、フルランクとまでは行かなかったものの、落ちたのは10次元くらいで、「なかなかdisjointで良い辞書だった」 ということになったらしいです。人間の感性が2,000次元なのか、あるいはそれを表す言葉の世界が2,000次元なのか。そのような区別も微妙な所かも知れませんが。良いデータに着目すると良いシステムが作れるという一例だと思います。 検索対象に対するインデキシングはメタデータに含まれる単語を利用したり、色調などの特徴量を意味空間上にマッピングしておくことで行うようです。 たとえば「暖かい音楽」で検索した場合は、ロングマンの辞書における「暖かい」の定義からその意味空間におけるベクトルを求め、成分の絶対値が大きい数次元に射影した部分空間上で近傍に来る検索対象を求める。LSIは全次元を使って距離を計算するのに対し、清木先生の手法では部分空間だけに着目するので非常に速い。 この研究に基づいて作られた感性検索のシステムはキャノンに注目され、御手洗社長の前でデモをしたこともあるとか。キャノンの出資でアメリカでのパテントも取ったそうです。 何年後かには、感性検索の機能が取り込まれたカメラが売り出されているかも知れません。ファインダーに入った対象の色調に応じて撮影の方式を変えるとか。 Posted by taro at 2006年12月28日 22:08 |
コメント
非常に面白い研究ですね。
(ただ数学モデルは勉強不足で理解できませんでした。あとでググってきます)
ひとつ疑問に思ったのは、
「音楽データベース」の方は、いかにつくられたのか?
ということですね。
単語の方は、既存の辞書(つまり、最大公約数的なDB)に基づいて
作成されていますが、音楽データベースの方は、何に基づいて作成
されているのでしょうかね。(それと、曲数、年代、ジャンル、等)
また、辞書データと、メタデータを付与した「音楽データベース」
とのマッチングをされていると理解したのですが、メタデータその
ものは、人力で付加していったのでしょうか。
例えば、「森のくまさん」という曲には、[軽快][楽しい][ハッピー]
などのタグをつけていくとか。場合によっては、[怖い][恐怖][どっきり]
[びっくり]などのタグも考えられます。つまり解釈に依存します。
もし人力でアドホックに付与しているとしたら、そのメタデータの妥当性
を考えなければならないと思うのですが、どういった方法で「音楽とメタデ
ータの対応関係」の妥当性を保証しているのかが、気になるところです。
一応、
Kiyoki Laboratory - Multidatabase Laboratory (MDBL)
http://www.mdbl.sfc.keio.ac.jp/
は見てみました(見つけられませんでしたorz)。
taroさんのご意見もあわせてお聞かせいただけると幸いです。
Posted by: txzm at 2006年12月29日 04:37
以下の論文が一番関係が深いのではないかと思います。
複数の音符列から構成される音楽データを対象とした印象メタデータ抽出方式
調やテンポの組み合わせに対して印象語を割り当てるという先行研究があって、それをもとにしているみたいです。
この方法だと自動でメタデータを付けられますね。
ただ、前回お話した時は、制作者によって付けられたメタデータも利用しているようなことを仰っていました。
Posted by: taro at 2006年12月29日 10:52
