Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Multimedia (https://www.delphipraxis.net/16-multimedia/)
-   -   Delphi Sprache erkennen (https://www.delphipraxis.net/103277-sprache-erkennen.html)

argonix 13. Nov 2007 17:27


Sprache erkennen
 
Hallo!
Für eine Anwendung ist es ein nützliches Feature, wenn die Sprache des Nutzers/dessen Befehle erkannt werden können.
Ist es möglich, den vom Mikrofon kommenden Datenstrom mit einem vorher aufgenommenes Muster (WAV-Datei) zu vergleichen und bei z.B. 70% Übereinstimmung eine Funktion auszuführen, wie das bei manchen Handys auch schon funktioniert? Und wenn ja, wie?

shmia 13. Nov 2007 17:36

Re: Sprache erkennen
 
Das ist so gut wie unmöglich!
Du müsstest Professor oder Doktor der Informatik sein und tiefgehendes Wissen über Digitalfilter, Fouriertransformation, Neuronale Netzwerke, usw. haben.
Sprachausgabe ist dagegen relativ einfach, da man auf Windows XP (oder höher) auf Schnittstellen zurückgreifen kann.

marabu 13. Nov 2007 17:40

Re: Sprache erkennen
 
Oder du kletterst auf die Schultern anderer um weiter sehen zu können: klick

Grüße vom marabu

argonix 13. Nov 2007 18:11

Re: Sprache erkennen
 
Also studieren möchte ich das nicht unbedingt... :wink:
Mit Microsofts SpeechAPI habe ich schon gearbeitet, aber nur in umgekehrter Richtung. Ich glaube eine Spracherkennung ist damit auch nur in Englisch möglich. Es geht mir auch mehr darum, ein vorher gesprochenes Muster im Input wiederzuerkennen, und nicht ganze Sätze.

P.S: Ich schau' mal, ob ich die englische SpeechRecognition zum laufen kriege.

omata 13. Nov 2007 22:46

Re: Sprache erkennen
 
Hallo argonix,

ich habe mich auch gerade damit beschätigt, schau doch auch mal
hier.

Gruss
Thorsten

argonix 14. Nov 2007 13:58

Re: Sprache erkennen
 
Liste der Anhänge anzeigen (Anzahl: 1)
Super! Die Informationen in der PDF-Datei sind hervorragend, so habe ich mir eine Analyse auch vorgestellt. Leider habe ich nicht das Know-How, um einen Audio-Stream oder eine Datei so zu zerlegen und zu analysieren. Auch die neuronalen Netze wären ein Problem. (Ich habe sowas erst einmal in der allereinfachsten Form in meiner KI verwendet)
Ich werde mich deshalb mit der SpeechAPI begnügen. Das Problem ist, dass mein Programm, welches ich der Anleitung nach erstellt habe, bei der Erkennung immer mit einer AV abbrach. Ich habe dann ein Demo-Projekt ausprobiert, aber auch dieses funktionierte nicht. Die Original-Binaries von Microsoft hingegen funktionieren perfekt!
Ich habe die Demo mal angehängt. Funktioniert die bei euch?
(Vor benutzung muss das Speech ActiveX importiert werden)


Alle Zeitangaben in WEZ +1. Es ist jetzt 06:17 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz