DSpace About DSpace Software
 

NAGOYA Repository >
A500 情報学部/情報学研究科・情報文化学部・情報科学研究科 >
A500d 学位論文 >
1.博士論文(情科博・論情科博) >

Please use this identifier to cite or link to this item: http://hdl.handle.net/2237/11606

Title: 多様な歌唱様式を予測・説明する歌声音響信号の分析合成モデルとその応用に関する研究
Authors: 大石, 康智
Issue Date: 25-Mar-2009
Other Identifiers: 甲8397
Abstract: 人間の口から発せられる音響事象の一つである歌声は、歌詞に込められた感情や想 いを旋律に乗せて伝達する最も身近な音楽演奏手段である。歌声は、これまで、音響 学、生理学、解剖学、心理学、歌唱学といった多角的な立場から研究され、歌声知覚 や生成機構の解明に向けた様々な知見が得られた。例えば、歌声の旋律を表す基本周 波数(F0) には、通常の話声に見られない、ビブラートなどの動的な変動成分が存在 する。また、歌声の音色を表すスペクトルの3kHz 付近には、顕著なピーク(歌声特 有の響き成分)が存在し、このピークは音声振幅やビブラートに同期して振幅変調さ れる。さらに、これらの変動成分の動きは歌唱者ごとに多様であり、個人性知覚に寄 与する特徴である。しかし、歌声を工学的に利用する実用的なシステムでは、このよ うな音響的特徴の時間的な動きが精緻にモデル化されていなかった。そのため、ハミ ング検索システムでは歌唱者によってその検索性能は低く、歌声合成システムでは多 様な歌唱様式による歌声の合成が困難であった。同じ歌声であっても、人間は歌唱様 式や技術の差を容易に区別できるように、システムも歌唱者による歌声の多様性を理 解し特徴づけた上で、目的となる歌声の認識や合成を行うべきである。 そこで本研究では、多様な歌唱様式を予測・説明する歌声音響信号の分析合成モデ ルを構築する。そのために、従来のように特定の歌唱者や歌唱法に限定するのではな く、一般人を含めて、様々なレベルの歌声を対象とした大規模データベースを用いる。 まずはじめに、聴取実験と自動識別実験に基づいて、歌声と通常の話声を人間と同 程度の性能で識別しうる信号特徴尺度を構成する。通常の話声との識別の観点から、 あらゆる歌声に共通する音響的特徴として、スペクトルや音高の時間的な変動成分の 重要性を示す。 次に、歌声の音高(F0) に焦点を当て、その時間的な動きをモデル化し、歌唱者ごと にどのように動きが異なるか、歌唱様式を特徴づけることに取り組む。本研究では、 F0 が歌唱様式を特徴づけるなんらかの微分方程式に従って生成されると想定する。し かし、この微分方程式が実際どのような形をしているのかは未知である。そこで、観 測されるF0 から、その背後にある微分方程式を明らかにする問題と位置づけ、2 つの モデルを提案する。1 つ目のモデルでは、F0 とその時間微分によって構成される相平 面もしくは相空間上にF0 軌跡を描き、その同時確率分布によってF0 の動きをモデル 化する。相平面は、複雑で解けない微分方程式の解の性質を調べるための便利な手段 であり、この平面の同時確率分布が近似的に微分方程式を表現すると考えた。このモ デルの有効性を2 つの観点から評価した。まず提案モデルによってF0 軌跡から階段 状の目標音高軌跡を推定し、これをハミング検索の検索クエリに利用したところ、従 来法と同等以上の性能が得られた。次に、提案モデルによって特徴づけられる動的変 動成分から、歌唱者ごとの歌唱様式を分析した。そして、提案モデルが歌唱様式を大 まかに自動分類できることを評価実験から確認した。 2 つ目のモデルは、F0 制御モデルである。旋律を表す階段状の音高軌跡を入力とし、 これに様々な動的変動成分が複雑に重ね合わされた状態でF0 が出力されると想定し、 この入出力関係を全極モデルで表現する。この全極モデルのパラメータ(逆フィルタ のインパルス応答)によって、F0 動的変動成分が表現される。そして、観測される F0 だけから、反復法によって、階段状の音高軌跡と逆フィルタのインパルス応答を 推定するアルゴリズムを提案する。逆特性のインパルス応答を推定することは、線形 微分方程式の係数を近似的に求めていると考えることができる。評価実験では、提案 手法によって、F0 軌跡から階段状の音高軌跡と動的変動因子を表すインパルス応答 を適切に推定できること、また推定されたこれらの信号からF0 軌跡を再合成できる ことを正解率の観点から評価した。最後に、ある歌唱者のF0 動的変動成分を別の歌 唱者の動的変動成分と取り換え、声質と音高を変化させることなく歌唱様式だけを自 由に変換可能な歌声合成手法を提案する。
Description: 名古屋大学博士学位論文 学位の種類:博士(情報科学) (課程) 学位授与年月日:平成20年3月25日
URI: http://hdl.handle.net/2237/11606
Appears in Collections:1.博士論文(情科博・論情科博)

Files in This Item:

File Description SizeFormat
DthesisOhishi200903.pdf9.56 MBAdobe PDFView/Open

There was reading in 72 pieces of the previous month in this item.

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback