Spectral modeling synthesis

スペクトラルモデリング合成
Roads 1996, p. 153[1]を日本語訳

Spectral modeling synthesisスペクトラルモデリングシンセシスSMS)は正弦波と色付きノイズを用いた楽音分析合成手法および音声分析合成手法である[注 1][2]

概要

SMS分析/合成の処理概要
    Bonada et al. 2001 Fig.1 & 2に基く
Sinusoidal modeling
Sinusoidal Analysis/Synthesis System
(McAulay & Quatieri 1988, p. 161[3] に基く)

SMSは調波成分残余成分 (非調波成分; ノイズ成分) の組合せとしてモデル化する。

楽音分析合成 / 音声分析合成として次の要素から構成される。

このモデルは多くのタイプのオーディオ信号に適用できる。例えば音声信号は、声帯振動で生じるゆっくり変化する調波音と、唇や口で生じる広帯域ノイズ状音を含む。同様に楽器も、調波成分と、ノートの発音/変更時に生じるノイズ状音の両方を発する。

脚注

注釈

  1. ^ 本手法は調波解析/調波合成に基づいており、その意図は調波成分が主役となる楽音音響分析音響合成である。
  2. ^ 加法性ホワイトガウスノイズ (AWGN): パワースペクトル(周波数領域の強度)が全周波数で同じ強度(=白色)で、振幅分布(時間領域の強度)がガウス分布に従うノイズ

出典

  1. ^ Roads 1996, p. 153, Figure 4.23: Overview of spectrum modeling synthesis.
  2. ^ Serra & Smith 1990, p. 12. "It describes a technique called spectral modeling synthesis [SMS], that models time-varying spectra as (1) a collection of sinusoids controlled through time by piecewise linear amplitude and frequency envelopes (the deterministic part), and (2) a time-varying filtered noise component (the stochastic part). The analysis procedure first extracts the sinusoidal trajectories by tracking peaks in a sequence of short-time Fourier transforms. These peaks are then removed by spectral subtraction. The remaining “noise floor” is then modeled as white noise through a time-varying filter. A piecewise linear approximation to the upper spectral envelope of the noise is computed each successive spectrum, and the stochastic part is synthesized by mean of the overlap-add technique."
  3. ^ McAulay & Quatieri 1988, p. 161, Fig. 8. "This block diagram of the sinusoidal analysis/synthesis system illustrates the major functions subsumed within the system. Neither voicing decisions nor residual waveforms are required for speech synthesis."

参考文献

関連項目

外部リンク

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya