AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Projekte Spracherkennung (Einzelworterkennung)

Spracherkennung (Einzelworterkennung)

Ein Thema von omata · begonnen am 29. Sep 2007 · letzter Beitrag vom 13. Feb 2016
Antwort Antwort
Seite 1 von 4  1 23     Letzte » 
omata
Registriert seit: 26. Aug 2004
Wie hier bereits erwähnt,
stelle ich nun mal ein Programm vor, dass eine Spracherkennung (Einzelworterkennung) durchführt.

Im Anhang befindet sich auch eine Dokumentation.

Viel Spass beim Testen.

Wichtig für den Quellcode: Zeos-Komponenten

Gruss
Thorsten
Miniaturansicht angehängter Grafiken
spracherkennung.png  
Angehängte Dateien
Dateityp: pdf myvoicescanner_375.pdf (725,4 KB, 626x aufgerufen)
Dateityp: zip myvoicescanner.exe_199.zip (2,62 MB, 619x aufgerufen)
Dateityp: zip myvoicescanner_181.zip (2,21 MB, 390x aufgerufen)

Geändert von omata (14. Aug 2011 um 19:05 Uhr)
 
Go2EITS

 
Delphi 7 Personal
 
#2
  Alt 30. Sep 2007, 07:12
@omata
Dank für Deinen Beitrag und dem interessanten Programm. Ich habe zwar kein Micro, aber die Möglichkeit auch andere Quellen anzuschließen, finde ich interessant. Aber spannend wird es, wenn ich dem Programm z. B. sage: "Runterfahren" und das Programm fährt mir den Computer runter. Ich meine damit, dass, wenn ein Wort erkannt wird, eine definierte Aktion ausgeführt wird.
Die Dokumentation als PDF ist sehr umfangreich. Sollte man sich mal ansehen.

Beste Grüße
Go2EITS
  Mit Zitat antworten Zitat
GeMo

 
Delphi 7 Professional
 
#3
  Alt 30. Sep 2007, 10:44
hmmm... irgendwas scheine ich falsch zu machen...
ich habe das programm gestartet und es ist mikrofon ausgewählt.. jedoch kann ich keine aufnahme starten :/
um gleich vor zu beugen: mein mikrofon funktioniert in allen anderen anwendungen...
  Mit Zitat antworten Zitat
Relicted

 
Delphi 10.4 Sydney
 
#4
  Alt 30. Sep 2007, 11:28
hört sich ja fast nach einer diplomarbeit an... cool gemacht

jetzt noch ne komponente zum einsatz in anderen programmen und ich spring im kreis )

gruß
reli
  Mit Zitat antworten Zitat
Florian H

 
Delphi 6 Professional
 
#5
  Alt 30. Sep 2007, 11:48
Zitat von GeMo:
hmmm... irgendwas scheine ich falsch zu machen...
ich habe das programm gestartet und es ist mikrofon ausgewählt.. jedoch kann ich keine aufnahme starten :/
um gleich vor zu beugen: mein mikrofon funktioniert in allen anderen anwendungen...
Ich zitiere aus der Doku:

Zitat:
Wenn Symbole und Personen angelegt wurden, konnen uber den Reiter Aufnahme Referenzmuster
aufgenommen, zugewiesen und in der Datenbank abgelegt werden.
Florian Heft
  Mit Zitat antworten Zitat
Benutzerbild von Hador
Hador

 
Turbo Delphi für Win32
 
#6
  Alt 30. Sep 2007, 13:02
Ein echt cooles Programm.

Was mir so aufgefallen ist:
  • Anfangseinstellungen sind recht kompliziert und keinesfalls inuitiv. Hierfür würde ich dir einen Assistenten empfehlen: 1. Person erstellen, 2. Symbol erstellen, 3. Sound aufnehmen, bei bedarf zurück zu Punkt 2.
  • Das automatische Schneiden macht irgendwie bei mir nichts
  • Das manuelle schneiden löscht einfach den Bereich vor dem Marker. Was ist aber, wenn ich den Bereich dahinter löschen will? Besser, man kann einen Teil markieren und diesen dann löschen.
  • Es gibt Leute mit mehreren Soundkarten (ich habe bspw. drei). Bei dir kann man zwar auswählen, ob von Mikrofon oder Line-In aufgenommen werden soll, nicht jedoch von welcher Soundkarte.
  • Die erkennung ist noch nicht ganz so toll. Ich habe bei mir mal Sieben und Acht aufgenommen, und vorallem bei der Sieben hatte er erhebliche Probleme. Siehe:
    Code:
    Sieben [Lars Kiesow] (73,1%)
    Kein Symbol erkannt.
    Acht [Lars Kiesow] (62,0%)
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Sieben [Lars Kiesow] (63,0%)
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Acht [Lars Kiesow] (65,4%)
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Acht [Lars Kiesow] (55,9%)
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Sieben [Lars Kiesow] (72,8%)
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Sieben [Lars Kiesow] (69,5%)
    Acht [Lars Kiesow] (61,7%)
    Acht [Lars Kiesow] (56,5%)
    Acht [Lars Kiesow] (61,5%)
    Acht [Lars Kiesow] (62,9%)
    Kein Symbol erkannt.
    Kein Symbol erkannt.
    Sieben [Lars Kiesow] (80,9%)

EDIT: Habe gerade gelesen, dass das Schneiden ja über linke/rechte Maustaste geht. Einfaches markieren mit der linken fände ich einfacher, aber es geht auch so. Ausprobieren konnte ich es leider nicht, da sich das Programm nicht ein zweites mal starten lässt (Microsoft Application Error Reporting wird gestartet).

EDIT2: Habe gerade gemerkt, dass der erste Prozess noch lief, hatte sich scheinbar beim beenden aufgehangen. Der fehler beim erneuten startet kam dann von der DB, auf die du 2x zugreifen willst. Dieser kommt auch, wenn du das Prgm. ganz normal 2x gleichzeitig startest.
Lars Kiesow
  Mit Zitat antworten Zitat
Benutzerbild von RWarnecke
RWarnecke

 
Delphi XE8 Enterprise
 
#7
  Alt 30. Sep 2007, 13:45
Hallo,

ich habe gerade Dein Programm getestet. Schonmal nicht schlecht. Nur folgende Dinge würde ich mir noch wünschen :
  • Auswahl des Audiogerätes
  • Eine einfachere Bedienbarkeit, finde ich ziemlich umständlich

Wieso werden zwei Fenster geöffnet, wenn ich unter Optionen-->Einstellungen auswähle ?
Rolf Warnecke
  Mit Zitat antworten Zitat
omata

 
Delphi 7 Enterprise
 
#8
  Alt 30. Sep 2007, 14:35
Hallo,
Zitat von Go2EITS:
... Aber spannend wird es, wenn ich dem Programm z. B. sage: "Runterfahren" und das Programm fährt mir den Computer runter. Ich meine damit, dass, wenn ein Wort erkannt wird, eine definierte Aktion ausgeführt wird.
Das ist zwar eine Gute Idee, aber ich wollte hier nicht Microsoft Speech nachbauen.

Zitat von Relicted:
... jetzt noch ne komponente zum einsatz in anderen programmen und ich spring im kreis )
Zugegeben, schöne Idee. Aber so einfach ist das dann auch wieder nicht.

Zitat von Hador:
...Die erkennung ist noch nicht ganz so toll. Ich habe bei mir mal Sieben und Acht aufgenommen, und vorallem bei der Sieben hatte er erhebliche Probleme.
Die Erkennungrate hängt sehr stark von den Referenzmustern ab. Ich hatte auch schon Soundkarten (nur Laptops) bei denen so schlechte Signale von der Soundkarte kamen, dass damit keine guten Referenzmuster erstellt werden konnten. Die Signale werden zwar normalisiert, dies führt aber bei sehr leisen Amplituden zu verrauschten Signalen. In der Doku ist ja ein Bild von einer aufgenommenen Sieben zu sehen. Sieht sie bei dir auch so kräftig und satt aus?
Sieben sollte eigentlich immer sehr gut zu erkennen sein. Um die Trefferquote noch weiter zu erhöhen können auch mehrere Referenzmuster für ein Symbol aufgenommen werden.
Die Refenrenzmustern sollte man auf jeden Fall optimieren, falls eins nicht so gut geht -> löschen und neu aufnehmen. Deutlich sprechen und wie oben erwähnt, das Signal sollte nicht zu leise sein.
Spracherkennung ist hochkompliziert und immer garantiert nicht fehlerfrei. Trotzdem bin ich begeistert von der Erkennunggenauigkeit des Systems, weil ich mich mit mehreren Techniken beschätigt habe (Neuronale Netze, Dynamic Time Warping, LPC, Cepstrum, reine FFT, Spektrum). Und als ich das erstemal dieses Konzept getestet hatte, bin ich fast vom Stuhl gerutscht, weil die Erkennungrate bei 100% lag. Sie liegt in Wirklichheit bei <100% aber eben auch bei >95% und das will schon etwas heißen!

Zitat von Hador:
... Habe gerade gemerkt, dass der erste Prozess noch lief, hatte sich scheinbar beim beenden aufgehangen. Der fehler beim erneuten startet kam dann von der DB, auf die du 2x zugreifen willst. Dieser kommt auch, wenn du das Prgm. ganz normal 2x gleichzeitig startest.
Ups, sowas baue ich eigentlich in jedes Programm ein. Hier hab ich es irgendwie übersehen.

Zitat von RWarnecke:
  • Auswahl des Audiogerätes
  • Eine einfachere Bedienbarkeit, finde ich ziemlich umständlich
Wieso werden zwei Fenster geöffnet, wenn ich unter Optionen-->Einstellungen auswähle ?
Das mit den Soundkarten ist ebenfalls ein guter Hinweis, den Gedanken hatte ich auch schon mal kurz. Allerdings stand der nicht so hoch auf der Wunschliste, die restliche Funktion war mir da wichtiger.
Das mit den zwei Fenstern verstehe ich nicht so ganz. Es gibt ein Hauptfenster und ein Einstellungsfenster.


Vielen dank für eure Meinungen.
Bei der Entwicklung stand im Vordergrund das überhaupt ein einigermaßen funktionierendes Produkt zu stande kommt.
Es kann also durchaus sein, dass es noch Verbesserungen geben kann (gibt es die nicht immer), deshalb danke ich euch für die Hinweise. Allerdings sind in dieses Projekt bis jetzt >200 Stunden reingeflossen und ich muss ehrlich zugeben, ich kann es nicht mehr sehen. Deshalb wird es erstmal keine Änderungen geben.
Ich wollte es euch mal vorstellen, weil ich das Thema nach wie vor hoch interessant finde und ich mal zeigen wollte das es durchaus möglich ist soetwas zu realisieren.
Vielleicht finde ich irgendwann nochmal die Muße eure Wünsche mit einzubauen.

Gruss
Thorsten
  Mit Zitat antworten Zitat
dominikkv

 
Delphi 2007 Professional
 
#9
  Alt 30. Sep 2007, 15:08
unter windows vista läuft dein prog nur mit administratorrechten.
Dominik
  Mit Zitat antworten Zitat
omata

 
Delphi 7 Enterprise
 
#10
  Alt 30. Sep 2007, 15:19
Zitat von dominikkv:
unter windows vista läuft dein prog nur mit administratorrechten.
Das kann gut sein, liegt vermutlich an der Firebird Embedded Datenbank.

Edit: Hast du eventuell die Window Firewall aktiv? Die unterschiedet ja leider nicht zwischen lokalen TCP/IP und von außen kommenden Verbindungen. Dort wird einfach alles gesperrt, deshalb geht dann Firebird nicht.

Gruss
Thorsten
  Mit Zitat antworten Zitat
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 00:01 Uhr.
Powered by vBulletin® Copyright ©2000 - 2022, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2021 by Daniel R. Wolf