| --> |
« Google本社訪問 | トップページ | 献血したらマッサージ » 2006年02月04日UC Berkeleyの学生さんカリフォルニア州立大学バークレイ校(UC Berkeley)の学生さんたちと合同ワークショップが行われ、なかなか面白いイベントでした。 終了後、イタリア料理店で打ち上げがあり、世界各国から集まっている優秀な学生さんたちとお話できました。 世界で最初の電子計算機を作ったと言われているJohn Atanasoffはブルガリア系アメリカ人で、ブルガリアではもっとも優秀なコンピュータサイエンスの学生に彼の名前を冠した賞が贈られるそうですが、それを受賞したという学生がいて、しかもブルガリアではコンピュータサイエンスが一番人気の学科らしく、ひょっとしたらブルガリアで一番賢い学生ではないかと思われる彼、Preslav Nakovといろいろお話しました。 Preslavが現在関わっているのはBioTextというプロジェクトで、バイオ関係の文書から知識発見を行うシステムを開発しているそうです。最近、NSFから840,000ドルの研究費を獲得したとか。 バイオ関係の文献からの知識発見といえば、単語間の間接的な共起関係からマグネシウムと偏頭痛の関連を発見したと主張している論文があり、昔読んで面白いと思ったのですが、Preslavに言わせるとあんなのはたまたま見つかっただけで、再現性もないのでダメだと言っていました。それを越える手法を目指しているようです。 Preslav自身はこれまで計算言語学の研究を主に行ってきたようで、機械翻訳のベンチャー企業でインターンをしていたこともあるそうです。 最近の機械翻訳の世界ではGoogleがその膨大な例文集から5-gramを作り、コンペティションで圧勝しているとか。一ページの中国語の文章を翻訳するのに丸二日かかるそうですが、出来上がった結果はまさに完璧。人間が訳したとしか思えない文章だそうです。 大規模コーパスの登場まではUniversity of South Carolinaの研究室が強かったようですが、今後は大きなデータを持たない大学は企業に太刀打ちできなくなっていくのではないかとのこと。 巨大データを扱う技術、たとえば高速な検索技術の方が重要になってきて、翻訳のアルゴリズム自体は進歩していないのではないか、と嘆いていました。 もうひとつ、Preslavから聞いた面白い話。 イギリスのカジノでは最近まで、ルーレットに投げ込まれた玉の軌道をコンピュータシミュレーションで計算し、止まる場所を予測して勝率を上げるということが認められていたそうです。完全な予測は無理でも、当たる確率を上げるだけの効果は十分あったとのこと。これもすごい話です。 Posted by taro at 2006年02月04日 20:41 |
