Jochen Robes über Bildung, Lernen und Trends

Syntaktische Mustererkennung

Bunke, Horst (1993). Strukturelle und syntaktische Mustererkennung, Chen, Pau & Wang (Eds.) Handbuch der Mustererkennung & Computervision. World Scientific. S. 163–209. ISBN 981-02-1136-8. In einem Telefonsystem ist es wahrscheinlich, dass die Genauigkeit der PER-Erkennung höher wäre als die Telefongenauigkeit. Dies liegt daran, dass viele der Telefonfehler innerhalb einer PER-Klasse liegen würden, zum Beispiel innerhalb der Klasse der stimmlosen Plosive, die alle mit dem PER `Burst` gekennzeichnet sind. Andererseits kann der Einfluss des Telefonsprachenmodells viele falsche Ausrichtungen mit dem Signal verursachen, wobei Einheiten, die im Sprachmodell „erzwungen“ erforderlich sind, in die erkannte Zeichenfolge eingefügt werden müssen. Dies wiederum kann zu unangemessenen Verbesserungen des Signals führen. Eine Zielleistung von 10% Fehlern und 10% Fehlalarmen scheint auf den TIMIT-Daten erreichbar.

Die syntaktische Mustererkennung kann anstelle der statistischen Mustererkennung verwendet werden, wenn die Muster eine klare Struktur aufweisen. Eine Möglichkeit, eine solche Struktur zu präsentieren, ist durch eine Reihe von Symbolen aus einer formalen Sprache. In diesem Fall werden die Unterschiede in den Strukturen der Klassen als verschiedene Grammatiken kodiert. 3. Methoden für den automatischen Standort Wir identifizieren drei grundlegende Ansätze für das Problem, PERs in laufender Sprache zu finden. Im ersten, dem wissensbasierten Ansatz, werden aus Beobachtungen des Sprachsignals, die auf die akustischen Eigenschaften des Signals in verschiedenen Frequenzbändern wirken, besondere Regeln konstruiert. Mithilfe von Handsatzschwellenwerten bilden die Regeln eine kontextsensitive Logik, um die Erkennung wichtiger phonetischer Ereignisse durchzuführen. Im zweiten, dem Spracherkennungsansatz, wird versucht, eine phonetische Transkription des Signals zu verwenden, indem so viele phonetische und phonotaktische Informationen wie möglich verwendet werden, und die resultierende Transkription bildet die Eingabe für eine Reihe von Zuordnungsregeln, die dann die Ereignisse von Interesse identifizieren. Im dritten Ansatz wird versucht, das Signal von breiter Klasse zu transkriptionen, wobei das Einheiteninventar ausgewählt wird, um den Ort der Ereignisse zu erleichtern. Es ist dieser dritte Ansatz, der die Grundlage für das in diesem Papier implementierte und getestete System bildet. In den folgenden Absätzen geben wir weitere Beschreibungen der drei Ansätze. 3.1 Wissensbasierte Methoden Ein aktuelles Beispiel für den wissensbasierten Ansatz ist das wegweisende Erkennungssystem von Liu (1996).

Dieses System, das als eine Komponente in einem Spracherkennungssystem konzipiert wurde, das auf akustischen und phonetischen Ereignissen und nicht auf statistischen Modellen basiert, ortet sogenannte „Landmarks“ in verbundenen Sprachsignalen. Diese Landmarken sind definiert als Zeiten, in denen die zugrunde liegende phonologische Beschreibung am deutlichsten im Signal realisiert wird. Die Regionen des Signals um diese Landmarken könnten nach ihrer Detektierung dann als Eingabe für ein Klassifizierungssystem fungieren, um den lexikalischen Zugriff zu fördern. Lius Arbeit beschreibt nur das erkennungsgemäße Verfahren für eine Teilmenge der Ereignisse, die für ein vollständiges Erkennungssystem erforderlich sind. Ihre beiden richtungsweisenden Klassen: abrupte und abrupt-konsonantale Abdeckung ziemlich eng die PERs platzen, Beginn und Offset. Auf der anderen Seite sind die Übergänge zwischen konsonantalen Typen (z.B. Nasal-zu-Frikativ) Wahrzeichen, aber keine PERs. Nasale und fricated Regionen sind durch Landmarken aus dem umgebenden Signal in Lius System segmentiert, aber nicht separat als für die Verbesserung erforderlich klassifiziert. Über den Autor – ANTTI KOSKI erhielt 1992 einen M.Sc.-Abschluss und Ph.Lic. Abschluss 1994 an der Universität Turku, Finnland.

Er ist Doktorand und wissenschaftlicher Mitarbeiter am Department of Computer Science der Universität Turku. Kürzlich hat er seine Forschungsarbeiten in den Jahren künstliche Intelligenz, Mustererkennung und medizinische Berechnung begonnen. Flasinski, Mariusz (2019). Syntaktische Mustererkennung. World Scientific. ISBN 978-981-3278-46-2. Strukturelle Methoden liefern Beschreibungen von Gegenständen, die für sich selbst nützlich sein können.