Multi-pulse LPC modeling of articulatory movements

The frame-by-frame variation of tongue profiles derived from X-ray film data is described in terms of the temporal patterns of four articulatory parameters. The temporal variation of each parameter, i.e., movement, is assumed to be the output of a time-invariant auto-regressive filter. Each filter i...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Speech communication Ročník 24; číslo 3; s. 227 - 248
Hlavní autoři: Bouabana, Soumya, Maeda, Shinji
Médium: Journal Article
Jazyk:angličtina
Vydáno: Amsterdam Elsevier B.V 01.06.1998
Elsevier
Témata:
ISSN:0167-6393, 1872-7182
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Popis
Shrnutí:The frame-by-frame variation of tongue profiles derived from X-ray film data is described in terms of the temporal patterns of four articulatory parameters. The temporal variation of each parameter, i.e., movement, is assumed to be the output of a time-invariant auto-regressive filter. Each filter is excited by a sequence of pulses, representing articulatory commands. The filter coefficients, and the position and amplitude of the pulses are determined by applying an MLPC method. The curve of synthesis error for each movement shows a rapid decrease up to a number of pulses corresponding to that of the syllables in the sentence and then the decreasing rate becomes distinctively slower suggesting the presence of syllable-size motor organization. The minimum number of pulses is determined by using an acoustic criterion. It depends on the number of the phonetic features, in the sentence, of which their realization is crucially related to their pertinent parameters. Die Veränderungen des Zungenprofils, abgeleitet aus aufeinander folgenden Aufnahmen eines Röngenfilmes, werden mit Hilfe der zeitlichen Merkmale von vier Artikulationsparametern beschrieben. Die zeitliche Veränderung eines jeden Parameters, d.h. die Bewegung der Zunge, wird als Ausgangssignal eines zeitinvarianten autoregressiven Filters modelliert. Jedes Filter wird durch eine Folge von Pulsen erregt, die die Artikulation repräsentieren. In diesem Modell entspricht die zeitliche Organisation der Sprache einer sylbenbasierten, phonologischen Repräsentation. Der Kurvenverlauf des Synthesefehlers für jede Bewegung zeigt einen rapiden Abfall bis hin zu der Anzahl an Pulsen, die der Sylbenanzahl im Satz entspricht; die Abnahme des Fehlers verlangsamt sich hiernach stark. Die minimale Anzahl an Pulsen wird durch ein akustisches Kriterium bestimmt. Es hängt von der Anzahl der Phoneme im Satz ab, deren Realisierung, wesentlich von besonderen Parametern abhängt. Les variations temporelles du profil de la langue enregitrées dans des images cinéradiographiques sont décrites par les mouvements de quatre paramètres articulatoires. La variation temporelle de chaque paramètre (mouvement) est supposée être la sortie d'un filtre auto-régressif invariant dans le temps. Chaque filtre est excité par une séquence d'impulsions qui représente la commande articulatoire. Les coefficients du filtre, la position et l'amplitude des impulsions sont déterminés par la méthode de la MLPC. Dans ce modèle, le geste syllabique apparaı̂t comme l'unité de base dans l'organisation temporelle des mouvements de la langue lors de la production de la parole. Par ailleurs, l'erreur de synthèse décroı̂t rapidement jusqu'au nombre d'impulsions de commande égal à celui des syllabes dans la phrase. Au delà de ce nombre, la pente de l'erreur devient faible. Le nombre minimum d'impulsions pour chaque paramètre articulatoire est déterminé en utilisant un critère acoustique. Il dépend du nombre des traits phonétiques dans la phrase dont la réalisation dépend d'un paramètre particulier.
Bibliografie:ObjectType-Article-1
SourceType-Scholarly Journals-1
ObjectType-Feature-2
content type line 23
ISSN:0167-6393
1872-7182
DOI:10.1016/S0167-6393(98)00012-0