河合塾グループ 河合塾
  1. 大学検索トップ
  2. 東京工科大学
  3. 大学からのお知らせ
  4. ゼミ研究室紹介
とうきょうこうか

東京工科大学

  • 大学HP

ゼミ研究室紹介

掲載している内容は、2021年8月時点のものです

メディア学部 メディア学科
サウンド×ヒューマン研究室

“音”の情報を収集し解析する技術を積み重ね
私たちの日常生活にフィードバックする

ディープラーニングの導入で音声認識の精度を高める

「音」をひもとく様々な研究を展開している

音声認識や音響信号処理を中心として、音にまつわる様々な現象を研究しているのが、サウンド×ヒューマン研究室だ。指導する大淵康成先生は、かつて企業の研究所に所属した時代にはニューラルネットワークの研究をしていたが、あるときに一転して“音声”の解析に取り組み始めたという。以来、音を解析して生かすスペシャリストとして、独自の研究を深めている。

「人間の音声認識技術を研究するにあたり、どこからどこまでが人間の喋った声で、どれが雑音なのかということを判別させることが重要でした。そこで、話し声を検出する“Voice Activity Detection”という技術に、ニューラルネットワークから発展した“ディープラーニング”技術を適応させようと考えました。結果、人工知能に多くの音声データを学習させることで、雑音のなかから人の声だけを識別できるようになりました。以前に培ったニューラルネットワークの技術や知識が、音の研究にも生かされたことになります」と大淵先生。「音の研究を始めたときは、リセットしてイチからのつもりでしたが、結果的にはつながっている。ちょっと不思議な気がします」

事実、“音”を研究対象にしているが、その手法は人工知能の利用や、情報処理技術の活用などのITの王道。科学的センスや思考力、技術の積み重ねが不可欠なのだ。

音と視覚情報を組み合わせたユニークな“音のアーカイブ”

VR空間の中の移動に合わせて、
現場で録音した音が立体的に聞こえてくる

サウンド×ヒューマン研究室では、音声認識以外にも、ユニークな“音”にまつわる様々な研究を行っている。例えば“音のアーカイブづくり”。バーチャルリアリティ映像に現場で収録した音を加工して埋め込むことで、音と画像がリンクした仮想空間をつくり上げた。

「担当していた大学院生は、自分の地元のお祭りに深い興味を抱いており、お祭り独特の“音”を保存したいという動機から研究をスタートさせました。そこでお祭りのVR映像に収録した音を組み合わせることで、現場の臨場感を保った音のアーカイブを実現しました。彼がつくったソフトでは、キーボードを使ってVRのなかを移動することができて、VR空間のなかでどんなふうに音が聞こえるのかもわかるのです」

このようにアイデアや工夫次第で、音の情報とその利用には幅広い可能性が秘められていると、大淵先生は話す。現在はビッグデータの時代といわれ、たくさんのデータを集めて分析することで、様々な事象を明らかにすることが可能だ。

「例えば街のなかにマイクを設置して日々の音を集めることで、交通事故の起こりやすい交差点が自然にわかるようになるでしょう。また、痴漢が出やすい場所が明らかになって危険が回避できるかもしれません。音のデータを蓄積していくことで、街そのものが賢くなっていく。そんなことができたらおもしろいと思いますね」

指導教員 大淵 康成 教授

東京大学大学院理学系研究科物理学専攻修士課程修了。1992年より日立製作所中央研究所および基礎研究所に所属。Carnegie Mellon University 客員研究員、早稲田大学客員研究員などを経て、2015年より現職。

ページの先頭へ

このページに関するお問い合わせ

大学・部署名 東京工科大学 広報課
Tel 0120-444-903
E-mail pr@stf.teu.ac.jp

入試問い合わせ先

  • 【担当部署】
    (工・コンピュータサイエンス・メディア・応用生物学部)広報課
    【電話番号】
    0120-444-903
    【所在地】
    東京都八王子市片倉町1404-1
  • 【担当部署】
    (デザイン・医療保健学部)広報課
    【電話番号】
    0120-444-925
    【所在地】
    東京都大田区西蒲田5-23-22
  • 東京工科大学資料請求

デジタルパンフレット

(*「テレメール進学サイト」が提供している画面へ遷移します)

閉じる

一緒に見られた大学