![]() |
Sprache erkennen
Hallo!
Für eine Anwendung ist es ein nützliches Feature, wenn die Sprache des Nutzers/dessen Befehle erkannt werden können. Ist es möglich, den vom Mikrofon kommenden Datenstrom mit einem vorher aufgenommenes Muster (WAV-Datei) zu vergleichen und bei z.B. 70% Übereinstimmung eine Funktion auszuführen, wie das bei manchen Handys auch schon funktioniert? Und wenn ja, wie? |
Re: Sprache erkennen
Das ist so gut wie unmöglich!
Du müsstest Professor oder Doktor der Informatik sein und tiefgehendes Wissen über Digitalfilter, Fouriertransformation, Neuronale Netzwerke, usw. haben. Sprachausgabe ist dagegen relativ einfach, da man auf Windows XP (oder höher) auf Schnittstellen zurückgreifen kann. |
Re: Sprache erkennen
|
Re: Sprache erkennen
Also studieren möchte ich das nicht unbedingt... :wink:
Mit Microsofts SpeechAPI habe ich schon gearbeitet, aber nur in umgekehrter Richtung. Ich glaube eine Spracherkennung ist damit auch nur in Englisch möglich. Es geht mir auch mehr darum, ein vorher gesprochenes Muster im Input wiederzuerkennen, und nicht ganze Sätze. P.S: Ich schau' mal, ob ich die englische SpeechRecognition zum laufen kriege. |
Re: Sprache erkennen
|
Re: Sprache erkennen
Liste der Anhänge anzeigen (Anzahl: 1)
Super! Die Informationen in der PDF-Datei sind hervorragend, so habe ich mir eine Analyse auch vorgestellt. Leider habe ich nicht das Know-How, um einen Audio-Stream oder eine Datei so zu zerlegen und zu analysieren. Auch die neuronalen Netze wären ein Problem. (Ich habe sowas erst einmal in der allereinfachsten Form in meiner KI verwendet)
Ich werde mich deshalb mit der SpeechAPI begnügen. Das Problem ist, dass mein Programm, welches ich der Anleitung nach erstellt habe, bei der Erkennung immer mit einer AV abbrach. Ich habe dann ein Demo-Projekt ausprobiert, aber auch dieses funktionierte nicht. Die Original-Binaries von Microsoft hingegen funktionieren perfekt! Ich habe die Demo mal angehängt. Funktioniert die bei euch? (Vor benutzung muss das Speech ActiveX importiert werden) |
Alle Zeitangaben in WEZ +1. Es ist jetzt 06:17 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz