ABS :
合成による分析(Analysis by Synthesis)

ALSR :
平均局在パルス同期頻度(Average Localized Synchronized Rate)

ANN :
人工ニューラルネットワーク

ARMA :
自己回帰移動平均モデル(autoregressive moving average)

ATR :
(株)国際電気通信基礎技術研究所と傘下の4つの研究開発会社 ATRのホームページ

Analysis by Synthesis :
合成による分析

Augmented Transition Network :
文献(3)で調べて下さい.

Average Localized Synchronized Rate :
平均局在パルス同期頻度

BPCEP :
バンドパスリフタLPCケプストラム

Bark scale :
可聴周波数帯域において,臨界帯域幅に相当する周波数帯域が等間隔になるような周波数尺度 1バルクは近似的に100メルに相当する.

Baum Welch algorithm :
バウムベルヒアルゴリズム

CART :
classification and regression tree

CD :
環境依存,文脈依存(context dependent)

CI :
環境独立,文脈独立(context independent)

CMU :
カーネギメロン大学

COSH Distortion :
COSH 歪み(尤度歪みの一種)

DARPA :
米国の国防総省

DBMS :
データベースマネージメントシステム

DCEP :
デルタLPCケプストラム

DL :
弁別閾

DSP :
デジタル信号処理用プロセッサー

DTW :
動的時間軸正規化アルゴリズム

EIH :
アンサンブルインターバルヒストグラム

EIH :
全体的間隔ヒストグラム

EM argorithm :
Expectation-Maximization アルゴリズム

ESPRIT :
ヨーロッパの研究プロジェクト ESPRITのホームページ

Ensemble Interval Histogram :
(全体的間隔ヒストグラム)

Ensemble interval histgram :
アンサンブルインターバルヒストグラム

Ergodic HMM :
エルゴディック HMM (HMMの状態遷移網のトポロジーの種類で,どの状態からでも全ての状態へ遷移できる)

FSLB :
フレーム同期レベルビルデイング

FSN :
有限状態ネットワーク(finite state network)

FWR :
全波整流器

GM :
全体の最大(global maximum)

Guided Propagation Networks :
文献(22)で調べて下さい.

HCNN :
隠れ制御ニューラルネット

HMM :
隠れマルコフモデル

HWR :
半波整流器

Hidden Markov Model :
隠れマルコフモデル

IHC :
内有毛細胞

IIR :
infinite impulse response(デジタルフィルタ)

IRST :
イタリアの研究機関 IRST(Istituto per la Ricerca Scientifica e Tecnologicaのホームページ

Inner Hair Cells :
内有毛細胞

JND :
Just Noticeable Difference 丁度可知差 知覚的に検知できる最小の刺激変化や刺激差

K nearest neighbor rule :
k最近傍規則

K-means :
K平均

KNN :
k近傍

KS :
知識源 Knowledge Source

Knowledge Source :
知識源

LIMSI :
フランスの研究機関 LIMSIのホームページ

LM :
局所的な最大(local maximum)

LMA(Log-Magnitude-Approximation)analysis-synthesis :
対数振幅近似

LPC :
線形予測分析

LPC analysis :
LPC分析

LPF :
ローパスフィルタ

LR :
尤度比尺度

LVQ :
学習ベクトル量子化(learning vector quantization)

MAIA :
IRSTでのプロジェクト

MDI :
最小判別情報量(minimum discrimination information)

MKM :
変形K平均(modified K-means)

ML :
最尤(maximum likelihood)

MMI :
最大相互情報量(maximum discrimination information)

MS :
複数話者(multi speaker)

N-gram :
Nグラム

NG :
無文法

Naval Resource Management :
海軍資源管理(タスクの種類)

PARCOR :
パーコール

PDP :
並列分散処理

PLU :
擬似音素単位

QMF :
quadrature mirror filter

RM :
資源管理(タスクの種類)

Rayleigh quotient :
レイリー比

Resource Management :
資源管理(タスクの種類)

Rosenberg :
ローゼンベルグ(波)<音源に使う>

SA :
話者適応(speaker adaptation)

SD :
特定話者(speaker dependent)

SI :
不特定話者(speaker independent)

SMC :
短時間修正コヒーレンス(short time modified coherence)

SPL :
音圧レベル

TDNN :
時間遅れニューラルネット

TMTF :
時間的積分機能(Temporal Modulation Transfer Function)

Temporal Modulation Transfer Function :
時間的積分機能(聴覚)

UWA :
(unsupervised clustering without averaging)

VPL DataGlove :
VPL データグローブ

VQ :
ベクトル量子化

WP :
単語対文法

Weber Fechner :
ウエーバーフェフィナー(の法則)

Weber fraction :
ウエバー比

a first-order preemhasis filter :
一次のプリエンファシスフィルタ

absolute refractory period :
絶対不応期

acoustic knowledge :
音響的知識

acoustic phonetics :
音響音声学

acoustic theory :
音響理論

acoustic-phonetic approach :
音響音声学的アプローチ

acute :
高音調性(F2が高い)

adaptation :
適応

adaptive clustering :
適応的クラスタリング

adaptive learning :
適応学習

affricate :
破擦音

air flow :
気流

aliasing :
折り返し

all-pole filter :
全極型フィルタ

all-pole model :
全極モデル

allophone :
異音

alveolar :
歯茎音

annealing :
アニーリング(焼きなまし)

antiresonance :
反共振

anvil :
砧(きぬた)骨

articulation :
調音

articulatory apparatus :
調音器官

articulatory apparatus :
調音器官

articulatory configuration :
調音形状

artificial intelligence approach :
人工知能的アプローチ

aspiration :
気息音

aspiration :
呼気

associative memory :
連想記憶

asynchronously :
非同期

attractor :
吸収点

auditory analysis :
聴覚分析

auditory feedback :
聴覚フィードバック

auditory perception :
聴知覚

auto-crrelation :
自己相関

autoregressive moving average :
自己回帰移動平均モデル

back propagation learning :
誤差逆伝搬学習

back vowel :
後舌母音

background word :
背景単語

backward masking :
後向マスキング

bark scale :
バーク尺度(人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調べるための尺度の1つ)

bark scale :
バーク尺度

basilar membrane :
基底幕

basilar membrane :
基底膜

bigram :
バイグラム(2つ組み)

binary split algorithm :
逐次二分割アルゴリズム

binary tree :
二分木

biological :
生理学的

bottom-up :
ボトムアップ

bronchi :
気管支

burst :
破裂

canal :
耳道

categorical perception :
範疇的知覚

center clipper :
センタークリッパー

central masking :
中枢マスキング

central vowel :
中舌母音

centralateral masking :
両耳間マスキング

centroid :
中心点

cepstral trajectory :
ケプストラム軌道

cepstrum :
ケプストラム

chainmap :
チェーンマップ

chest :

circular convolution :
巡回畳み込み

classification :
識別

close vowel :
狭母音

cluster :
クラスタ

clustering :
クラスタリング

coarticulation :
調音結合

coarticulation of sounds :
調音結合

coarticulatory :
調音結合

cochlea :
蝸牛殻(かたつむり管)

codebook :
符号帳

command and control :
命令と制御

compact :
集約性(F1が高い)

complementary :
対称性

composite frequency response :
複合周波数応答

computation element :
計算素子

conceptually driven processing :
概念駆動型処理

condition :
整える

confirmation of recognition :
認識の確認

connected :
連続の(発声)

consonant :
子音

constriction :
狭め

context dependent :
環境依存,文脈依存

context independent :
環境独立,文脈独立

continuant vowels :
定常母音

convolution :
畳み込み

covariance method :
共分散法

coverage :
カバー率

cricothyroid :
環状甲状軟骨(多分)

critical band :
臨界帯域

critical band :
臨界帯域 音の大きさやマスキングなどにおいて,その様態が急に変化し始めるときの帯域で,たとえばつぎのように表現することができる.(1)帯域雑音の音圧レベルを一定に保った状態で帯域(幅)を増していくとき,その帯域雑音の音の大きさが増加し始めるときの帯域(幅)(2)帯域(幅)のスペクトルレベルを一定に保った状態で帯域(幅)を増していくとき,雑音の帯域の中心に置かれた純音のマスキング閾値が一定になるときの最小の帯域幅。また(2)の場合,臨界帯域内では,純音と雑音にちょうどマスクされると仮定して,そのときの信号対雑音比から臨界帯域を求めたものを特に臨界比(critical ratio)という.臨界比は,臨界帯域幅の約1/4であるが,低域では両者の差が増大する.臨界帯域幅の単位に,Barkが用いられることがある.

critical bandwidth :
臨界帯域幅

critical ratio :
臨界S/N比

cross validation :
相互検証

cues :
てがかり

data driven :
データ駆動

data driven processing :
データ駆動型処理

decision logic :
決定理論

demi-syllable :
半音節

dental :
歯音

derivation :
派生,派生物,語源

derivative :
導関数

deviation :
標準偏差

devoicing :
母音の無声化

dialer words :
電話をかける時の単語

dialogue corpora :
会話コーパス

dictionary :
辞書

difference limen :
弁別閾

diffuse :
拡散性(F1が低い)

diphthong :
二重母音

direct form implementation :
直接型表現

discharge :
放電

discrete Fourier transform :
離散フーリエ変換

distinctive phonetic unit :
弁別できる音素単位

distortion measure :
歪み尺度

dynamic programming :
動的計画法

dynamic time warping algorithm :
動的時間軸正規化アルゴリズム

ear drum :
鼓膜

ear model :
聴覚モデル

enhancement :
信号強調(フォルマントピークの強調)

ensemble interval histgram :
全体的間隔ヒストグラム

esophagus :
食道

excitation source :
励振源

excitatory :
(神経の)興奮性

explicit :
陽に

external canal :
外耳道

falsetto :
うら声

fault tolerance :
誤り耐性

feature detection :
特徴検出

feature extraction :
特徴抽出

feature measurement :
特徴抽出

feature-level :
特徴レベル

feed forward connectionist network :
フィードホワードコネクショニストネットワーク

filter bank :
フィルタバンク

filter bank spectrum analysis :
フィルタバンクスペクトル分析

finite codebook (collection) :
有限個のコードブック集(有限の大きさの符合帳)

finite codebook collection of spectral shapes :
スペクトル形状の有限個のコードブック集(スペクトル形状の有限の大きさの符合帳)

finite state network :
有限状態ネットワーク

first pass :
フゼストパス

fixed point :
固定点

flapped :
はじき音

flat :
平坦な(母音)

formant :
フォルマント

formant location :
フォルマントの位置

forward backward algorithm :
フォワードバックワードアルゴリズム

forward masking :
前向マスキング

frame rate :
フレームレート

frequency bands :
周波数帯域

frequency resolution :
周波数分解能

frication :
摩擦性

fricative excitation :
摩擦性の駆動源

fricative sound :
摩擦音

friction :
短い破裂

front vowel :
前舌母音

full wave rectifier :
全波整流器

fundamental frequency :
基本周波数

genioglossus muscle :
オトガイ舌筋 外舌筋のひとつ.下顎骨内面正中部より起こり舌尖と舌背の粘膜に向かって扇状に放散し,舌粘膜下面の舌ケン膜に終る.

glide :
渡り音

global maximum :
全体の最大

global time alignment procedure :
大局的な時間軸整合手順

glottal stop :
閉鎖音

glottis :
声門

gradient descent algorithm :
最急降下法

grave :
低音調性(F2が低い)

half wave rectifier :
半波整流器

hammer :
槌骨

hard limiter :
ハード決定

hard palate :
硬口蓋

harmonics :
調波構造

head movement label :
頭部動作ラベル

hidden control neural network :
隠れ制御ニューラルネット

hidden layer :
隠れ層

high-frequency :
(周波数の)高域

human vocal apparatus :
発声器官

human vocal tract system :
人間の発声機構

hypothesis-and-test :
仮説検証

implementation :
具体的な実現

incus :
砧(きぬた)骨

index :
番号

inhibitory :
(神経の)抑制性

inner ear :
内耳

inner hair cells :
内有毛細胞

input layer :
入力層

intensity :
(音の)強さ

inter-speaker :
話者間

intercluster :
クラスタ間

intra-speaker :
話者内

intracluster :
クラスタ内

invariance :
不変量

isolated :
孤立の(発声)

jaw :
あご

just-noticeable difference :
丁度可知差

knowledge aquisition :
知識獲得

labeling :
ラベリング,ラベル付け

language code :
言語符号

language processing :
言語処理

lateral :
側音

lax :
弛緩性(継続時間が

lax :
弛緩性(継続時間が)

learning vector quantization :
学習ベクトル量子化

left to right :
左から右への(処理)

left-right :
左から右への(処理)

level building :
レベルビルデイング(頬

level crossing rate :
レベルクロス率

lexical access problem :
辞書検索問題

lexical decoding :
辞書参照

lexical knowledge :
単語辞書知識

likelihood :
尤度

likelihood function :
尤度関数

linear predictive coding :
線形予測分析

linear predictive coefficient :
線形予測係数

lips :

liquid :
流音

local distance measure :
局所的な距離

local maximum :
局所的な最大

locus :
(フォルマントの起点)ローカス

log-concave :
対数凹

logarithmic frequency scale :
対数周波数軸

logarithmic growth factor :
対数の増大係数

long-term memory :
長時間記憶,長期記憶

loudness :
ラウドネス,音の大きさ

low-frequency :
(周波数の)低域

lung :

lungs :

malleus :
槌骨

masking :
マスキング

massively parallel computation :
超並列計算

matched filter :
マッチトフィルタ

maximum a posteriori probability :
最大事後確率

maximum entropy method :
最大エントロピー法

maximum likelihood :
最尤

maximum likelihood estimate :
最尤推定値

maximum likelihood method :
最尤推定法

maximum mutual information :
最大相互情報量

mechanical transducer :
機械変換器(耳の中の骨等)

mel scale :
メル尺度(人間の聴覚の特性にあわせて低周波部分は細かく,高周波部分は大まかに調べるための尺度の1つ)

mel scale :
メル尺度

mid vowel :
中舌母音

minimal phrase :
文節

minimum discrimination information :
最小判別情報量

mixture gaussian distribution :
ガウス分布の混合分布

modal voice :
地声

modified K-means :
変形K平均

more suitable :
より適する

motor command :
神経制御指令

mouth :

multi speaker :
複数話者

multilayer perceptron :
多層パーセプション

multimodal human interface :
マルチモーダル ヒューマン インターフェース

multinomial :
多項の

narrowband spectrogram :
狭帯域のスペクトログラム

nasal cavity :
鼻腔

nasal consonant :
鼻子音

nasal murmur :
鼻孔から出る定常的な有声音

nasal sound :
鼻音

nasal tract :
鼻道

nasality :
鼻音性

nearest neighbor labeling :
最近隣ラベル付け

nearest neighbor rule :
最近傍則

nearest neighbor search :
最近隣探索

neural network :
ニュラルネットワーク

neural transduction :
神経信号変換

neuro-muscular action :
筋肉を動かす神経信号?

neuromuscular control level :
発声器官制御信号レベル?

noise :
雑音

noise burst :
破裂部

noise criterion :
雑音基準

noncontinuant :
不連続な

nonlinear dynamical system :
非線形動的システム

nonlinearity :
非線形性

nonlinearity :
非線形素子

nostrils :
鼻孔

oculometer :
視線追従装置?

one pass :
ワンパス(アルゴリズム)

one state :
ワンステート(アルゴリズム)

one-stage :
ワンステージ(頬

open vowel :
広母音

oral cavity :
口腔

orthographic symbol :
綴り記号

output layer :
出力層

output probabilities :
出力確率

palatal :
硬口蓋音

parameterization :
パラメータ化

pattern classification :
パターン識別

pattern recognition approach :
パターン認識的アプローチ

pattern training :
パターン学習

percept :
知覚されたもの

perceptron convergence procedure :
パーセプトロン収束アルゴリズム

perplexity :
複雑さ,パープレキシテイ(タスクの複雑さの尺度)

pharynx :
喉頭

phoneme :
音素

phoneme lattice :
音素ラテイス

phonological unit :
音韻

pinna :
耳翼

pitch :
ピッチ

plain :
単純な(母音)

pole-zero filter :
極零型フィルタ

possible path expansion :
可能なパス展開

pragmatic knowledge :
プラグマテイックな知識

predictive residual :
予測誤差,予測残差

preemphasis :
プリエンファシス,事前強調

principal components analysis :
主成分分析

probability background :
背景確率

property :
特性

prosody information :
韻律情報

prototype :
プロトタイプ,試作品,原型,模範

psychoacoustic :
心理音響学

quadrature mirror filter :
高低の周波数特性が対称なフィルタ

quantization error :
量子化誤差

quefrency :
ケフレンシー

quick and dirty :
安直な

radiation :
放射

recurrent network :
回帰ネットワーク

recursive :
再帰

reference pattern :
参照パターン

relaxation point :
固定緩和点

release :
摩擦

repeller :
反発点

resonance :
共振周波数

robustness :
頑健さ

root power sum :
根のべき乗和

running spectrum :
スペクトル列?

segmental K-means :
セグメンタルK平均

segmentation :
セグメンテイション

self-organizing feature map :
自己組織化特徴マップ

self-organizing network :
自己組織ネットワーク

semantic knowledge :
意味知識

semi Markov model :
セミマルコフモデル

semivowel :
半母音

sensory information store :
感覚情報記憶

sequential adaptation :
逐次適応化

short time energy :
短時間エネルギー

short time modified coherence :
短時間修正コヒーレンス

short time spectral envelope :
短時間スペクトル包絡

short-time memory :
短時間記憶,短期記憶

sigmoid function :
シグモイド関数 f_\sigma(v)=\frac{1}{1+e^{-v/\sigma}}

signal-processing front end :
信号処理フロントエンド(音声波形をパラメータ表現に変換することを意味する)

silence :
無音,無音区間

silence :
無音区間

sillable :
音節

simulated annealing :
シミュレーションによる焼きなまし

simultaneous masking :
同時マスキング

single-layer perceptron :
単層パーセプション

soft palate :
軟口蓋

sonorant :
鳴音(鼻子音等)

sound :
音声

sound pressure :
音圧

sound spectrogram :
サウンドスペクトログラム

speaker adaptation :
話者適応

speaker conversion :
話者変換

speaker dependent :
特定話者

speaker independent :
不特定話者

speaker transformation :
話者変換

spectral distortion :
スペクトル歪

spectral envelope :
スペクトル包絡

spectral gap :
スペクトルギャップ

spectral representation :
スペクトル表現

speech perception :
音声知覚

speech production :
音声の生成

speech signal processing :
音声信号処理

spoken dialogue :
音声対話

spoken word recognition :
単語音声認識(泉君;-))

stapes :
あぶみ骨

sternothyroid :
胸骨と甲状軟骨の

stimuli :
波形

stimulus :
刺激

stochastic gradient technique :
統計的最急勾配法

stop gap :
ストップギャップ

stop gap :
閉鎖区間

strrup :
あぶみ骨

structural approach :
構造的なアプローチ

sub word :
サブワード(単語を構成する単位,音素,音節,あるいはVCV(母音-子音-母音),CVC(子音-母音-子音)などがある)

subglottic side, subglottal side :
声門下側

supraglottal side, supraglottal side :
声門上側

syllabic nasal :
はつ音

syllabic nasal :
ハツ音

syllabic sound :
音節

syllable :
音節 シラブル

syntactic analysis :
構文解析

syntactic knowledge :
構文知識

table lookup :
表参照

target :
目標

task oriented dialogue model :
タスク指向型対話モデル

temporal masking :
継時マスキング

tense :
緊張性(継続時間が長い)

text to speech synthesis :
テキスト音声規則合成

the bandpass lifted cepstral distance :
バンドパスリフタ-ケプストラム距離

threshold of hearing :
最小可聴閾

threshold of pain :
最大可聴閾

thresholding :
しきい値処理

throat :

throat cavity :
喉頭

tied mixture :
結び混合

time alignment :
時間的整合

time delay neural network :
時間遅れニューラルネット

time warp :
時間非線形伸縮

time window function :
時間窓関数

tonal language :
声調言語(中国語,タイ語など)

tonalness :
音色性

tongue :

tongue hump height :
舌の調音位置の高さ

tongue hump position :
舌の調音位置

top-down :
トップダウン

trachea :
気管

transducers :
音響電気変換器

transfer function :
伝達関数

transglottal :

transient :
過渡的な

transient sound :
過渡音

transmission channel :
伝送路

trigram :
3つ組み

tube :

turbulence :
乱流

turbulent :
乱流

two-level dynamic programming :
2段DP法

tympanic membrane :
鼓膜

undesired sound :
騒音

undesired sound :
騒音

uniform filter bank :
均一なフィルタバンク(周波数軸に対して均一に配置されたフィルタバンク)

unsupervised clustering without averaging :
平均化不要教師なしクラスタリング

unvoiced stop consonant :
無声破裂音

unvoiced :
無声

unvoiced fricative :
無声摩擦音

unvoiced fricatives :
無声摩擦音

unvoiced sound :
無声音

unvoiced stop :
無声破裂音

utterance label :
発声ラベル

uvular :
口蓋垂音

vector quantization :
ベクトル量子化

velar :
軟口蓋音

velum :
軟口蓋

vocal cords :
声帯

vocal fly :
ボーカルフライ(非常に低い声)

vocal fold (cord) :
声帯

vocal fold (cord) vibration :
声帯振動

vocal tract :
声道

vocal tract :
声道

vocoder :
ボコーダ

voiced :
有声

voiced fricative :
有声摩擦音

voiced fricatives :
有声摩擦音

voiced sound :
有声音

voiced stop :
有声破裂音

voiced stop consonant :
有声破裂音

vowel :
母音

vowel triangle :
母音の三角形

warping function :
非線形伸縮関数

warping pass :
伸縮パス

whisper :
ささやき音

whitening :
白色化

wideband spectrogram :
広帯域のスペクトログラム

windowing :
窓かけ

windowing design method :
窓の設計手法

windpipe :
気管

word hypotheses :
単語の仮説

word sensitive :
単語依存

zero crossing rates :
ゼロ交差率

μ-low encoding :
μ-low 符合化(対数符合化の一種)