「聞きたい音だけを聞く力」をロボットの耳やAIスピーカにも
片岡 章俊教授
Akitoshi Kataoka
専門領域・
研究テーマについて
専門分野について教えてください。
聞きたい音だけを選択的に収音し、その音を聞きたい人だけに届けることを目指して音に関する研究を進めています。人間は騒がしい人ごみの中でも、会話をしている相手の話を聞きとることができます。これはカクテルパーティ効果と言って人間が持っている素晴らしい能力の一つです。高性能な選択的な収音を実現し、ロボットの耳として、あるいはAIスピーカへの適用を想定しています。また、聞きたい人だけに音を届けるためには、複数のスピーカを用いて空間の任意の位置で音源が存在する状態を仮想的に作る必要があり、その実現にむけて研究しています。プロジェクションマッピングで投影した人物の位置に仮想的な音源を作り出し、人物にしゃべらすと言った音のVRに繋がる研究です。
専門分野の面白さは、どんなところですか?
音は時間と伴に振幅が変化する単純なものですが、例えば音声はその内容の他、話者の属性・個性やその時の感情まで含まれています。私の研究は、この身近なメディアを用いて新しい価値を創造するものです。うまく行かないことも多いですが、自分が考えたアイデアで処理した音がどんなものかすぐに聞け、うまく行った時の達成感は格別です。
受験生に向けて
受験勉強のコツがあればお教えください。
いろいろな問題集をやるのではなく、1つの問題集を繰り返し解く
もし先生が先端理工学部の学生なら、どんなプログラムを組み合わせますか?
私が担当する「リアル&バーチャルメディア」と組み合わせるとすれば、「人工知能」です。音声・音響信号などの音メディアもAIなどの学習を用いて処理することが必要になっています。