Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Multimedia (https://www.delphipraxis.net/16-multimedia/)
-   -   Delphi Frequenzmuster von wav-Dateien (https://www.delphipraxis.net/38541-frequenzmuster-von-wav-dateien.html)

hmbg 20. Jan 2005 16:34


Frequenzmuster von wav-Dateien
 
Ich möchte eine art Spracherkennungsprogramm programmieren und hab gedacht, das es sinnvoll wäre, wenn ich dafür eine originaldatei hab und das Frequenzmuster des gesprochenen mit dem original vergleiche. Wie kann man auf das Frequenzmuster einer wav-Datei zugreifen?

Danke, hmbg

shmia 20. Jan 2005 17:44

Re: Frequenzmuster von wav-Dateien
 
Zitat:

Zitat von hmbg
Ich möchte eine art Spracherkennungsprogramm programmieren und hab gedacht, das es sinnvoll wäre, wenn ich dafür eine originaldatei hab und das Frequenzmuster des gesprochenen mit dem original vergleiche. Wie kann man auf das Frequenzmuster einer wav-Datei zugreifen?

Spracherkennung kannst du vergessen, wenn du nur wenig Ahnung von höherer Mathematik hast.
Da du nicht weisst was eine FFT ist, müsstest du zuerst mal ein Grundstudium in Nachrichtenrechnik beginnen.

Sorry, wenn das jetzt etwas hart geklungen hat, aber ohne die tiefen Kenntnisse hast du keine Chance.

Neutral General 20. Jan 2005 18:22

Re: Frequenzmuster von wav-Dateien
 
Aus eigenem Interesse : Wie bekommt man denn das Frequenzmuster ?

Thunderman 20. Jan 2005 18:42

Re: Frequenzmuster von wav-Dateien
 
Letztendlich basiert jeder Ton aus einer Schallwelle, bzw. damit einer Schwingung. Diese Schwingung lässt sich durch viele übereinandergelegte Sinusfunktionen zusammensetzen. Diese haben jeweils eine andere Frequenz. Um nun diese Frequenzen zu erhalten muss man eine so genannte Fourier-Transformation durchführen. Das ist eine mathematische Vorgehensweise die man auch am PC mithilfe der sogenannten FFT (Fast-Fourier-Transform) durchführen kann. Der umgekehrte Weg ist auch möglich und heißt dann IFFT. Die Feinheiten dafür findet man bei Interesse im Internet. Audiosignalverarbeitung ist insgesamt recht komplex, vor allem wenn es an eine genauere Analyse und bearbeitung gehen soll (etwa Hoch oder Tiefpass oder andere Filter, Equalizer).


Alle Zeitangaben in WEZ +1. Es ist jetzt 18:10 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz