オクトーバーフェストで聞いた話

オクトーバーフェストに行った際に、友人から聞いた音響の話が面白かったのでメモがてら記録しておこうと思った。彼が大学で取り組んでいるのは、音声認識にかかわるソフトウェア開発だ。
音声認識は分野によって、たとえば音声によるテキスト入力などでは商品化もされている。しかし、これは音源とマイクの位置関係がはっきりしている場合だけなのだ。だからたとえばリビングでくつろぎながら、「テレビを点けて」とか「室温をもう少しあげて」とか機会に命令するなんてことは難しいらしく、現在も開発中なんだと。
難しさの原因は反響の効果がおおきいそうだ。反響による音声信号の乱れを取り除くアリゴリズムはいろいろと考えられているそうだ。面白いのはこのアルゴリズムにかけられた音声が、人間にとっては認識しやすいものであるにもかかわらず、自動認識がされづらい音声であるということだ。興味深い…とはいえ、完全に反響による効果を除ければ音声認識がうまくいくことはわかっているのだから、ノイズ除去アルゴリズムを改良すれば問題は解決しそうだと思うが。
僕は音声認識について何も知らないし深いことはわからないのだけど、解決すれば学術的にも産業的にも意義が大きい研究なのだろうなと思うと、少しうらやましいと思うのであった。