Spracherkennung
Hallo Experte,
Ich habe vor viel Audio Daten, nach Namen, Länge und Datum in einem Datenbank zu speichern. und ich wurde der Such von Diesen Daten per Voice machen. d.h. in Datenbank sind mehrere Waves gespeichert, bestimmte Waves haben zb. die wörter: - MArcel - Hammer - Dose - Laptop wenn ich zb die Audiodatei mit dem Wort "Hammer", brauche ich nur mein Mikrophone zu nehmen und "Hammer" sagen und erscheint die datei. ich versuche es gerade auf den Papier zu modellieren. Kann mir jemanden n tipps geben oder hinweis auf n lekture??? Danke in voraus poter |
Re: Spracherkennung
da hast du dir was vorgenommen. Ich würde das ganze so zu untersuchen das ich die ausschläge der Sounds ermittel und dann in den vorhandenen Dateien diese Ausschläge suche. Aber ich würde mir davon nicht viel Erfolg versprechen. Die Spracherkennung hat nicht umsonst einige Jahre Entwicklung hinter sich bis sie brauchbar einsetzbar war.
|
Re: Spracherkennung
Oder gibt es schon programme, die man in seinem delphiquelle einbinden kann?
werde dankbar für jede tipp grüß poter |
Re: Spracherkennung
Schaumal in Google nach Speaking Software vielleicht findes du was
|
Re: Spracherkennung
Moin, moin,
Ja man könnte sich mit den Speicherformaten beschäftigen. Da findet sich hier mehr zu, mit Delphi-Quellcode. Kommerziell gibt es das Signal-Lab von Mitov. Tja und bei Torry findet sich was zum AudioCapturén Audio Capture und Wave In Oder zur Entspannung kann man etwas FFT auf eine Wave ansetzten. Also wenn man nur zwischen fünf bis zehn Wörtern unterscheiden muß, dann konnte dies auch gut mit Delphi zu realisieren sein, eine Voice zu Rechtschreibung ist natürlich ein andres Format. Viel Erfolg // Martin |
Re: Spracherkennung
Ein kleines Beispiel ist hier zufinden.
Die Dokumentation sollte für dich interessant sein. Gruss Thorsten |
Alle Zeitangaben in WEZ +1. Es ist jetzt 10:05 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz