音声情報処理

担当教員

授業の到達目標及びテーマ

 音声をコンピュータで扱う基礎的な能力を身につけることを目標とします。  コンピュータを使うと、音声を生成したり、取り込んだ音声を加工できます。これらを可能にする技術がディジタル信号処理です。  本講義では、まず、音を扱うディジタル信号処理の入門的技法を紹介します。  次に、その技法を用いて実現できる音声処理の技法のいくつかの例を取り上げます。  最後に、音声処理の応用技術の一つとして連続音声認識システムを取り上げ、そのツールの利用方法を紹介します。

授業の概要と方法

 役立つ技能の習得のために、取り上げる技法はプログラミングと関連付けて紹介します。また、実際の音声データを扱います。  プログラミングを簡単にするために MATLAB を利用します。  また、フリーの連続音声認識システム(julius)を利用します。

授業計画

テーマ内容
1 ガイダンス 基礎知識確認/MATLAB復習/音声とは/ディジタル音声処理の応用
2 音声の生成 音響音声学/生成モデル/母音、子音/スペクトログラム/ホルマント
3 音声の知覚 マスキング/聴覚モデル/SNR
4 声道モデル 声道モデルによる音声の表現
5 音声の識別 母音の識別/DPマッチング
6 音声認識システム フリーツールjuliusの紹介
7 音響モデル HMM
8 言語モデル 文脈自由文法
9 周波数領域の音声処理 overlap add
10 ソースフィルタモデル ケプストラム/LPC
11 音声特徴量の推定 音声検出/ピッチ推定
12 音声インタフェース 音声インタフェースの概要/音声合成
13 ディジタル音声処理まとめ MATLABによるディジタル音声処理のまとめ
14 音声符号化 PCM/DPCM/ADPCM
15 まとめ 最終課題の発表

授業外に行うべき学習活動

配布資料の予習課題を行うこと。

テキスト

配布する資料に基づいて講義を進める。

参考書

書名: Theory and Applications of Digital Speech Processing 著者名: L. R. Rabiner, R. W. Schafer 出版社: Pearson 出版年: 2011 書名: ディジタル・サウンド処理入門 著者名: 青木直史 出版社: CQ出版社 出版年: 2006 書名: IT Text 音声認識システム 著者名: 鹿野清宏、伊藤克亘他 出版社: オーム社 出版年: 2001

成績評価基準

 講義内の課題、最終課題を総合して決定する。

情報機器使用

 授業支援システム、web ページ、ノートPCを利用する。

前年度の授業改善アンケートからの気づき

 特になし。

その他

解析学、確率と統計を履修していることが望ましい。また、ディジタル信号処理、情報理論を並行して履修することが望ましい。 詳細は web ページにも掲載します。 http://www.slp.k.hosei.ac.jp/~itou/lecture/2012/SpeechProcessing/index.html 第1回の講義の前に、MATLAB をインストールしておくこと。インストール方法は、RAT の web ページを参照のこと。http://rat.cis.k.hosei.ac.jp/article/rat/r/matlabinstall.html