Einzelnen Beitrag anzeigen

Schneider-Huetter

Registriert seit: 5. Mär 2004
97 Beiträge
 
Delphi 7 Personal
 
#32

Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar

  Alt 9. Aug 2006, 13:06
Hallo,
beim näheren Durchlesen des Artikels haben sich doch noch einige Fragen ergeben, v.a. beim Einteilen in die Frames und beim Gewichten mit dem Hanning-Fenster bin ich mir nicht ganz sicher, ob ich es richtig verstanden habe.
Ich habe mal 2 Graphiken angehängt, die zeigen, wie ich mir das Ganze vorstelle.
Bei folgenden Punkten bin ich mir noch unsicher:
- Ist das Aufteilen der Frames so richtig, wie ich es in den angehängten Graphiken eingezeichnet habe?
- Wird das Hanning-Fenster einfach über jeden Frame gelegt und ist genau so breit wie ein Frame?
- wenn ein Frame 0,37s lang ist, müsste dieser bei 5kHz doch 1850 Samples (0,37 s *5000 Hz), und nicht wie angegeben 2048 Samples enthalten. Kommt die 2048 vielleicht von der FFT, da man hier ja nur 2er-Potenzen verwenden sollte? Müssen die fehlenden 198 Samples dann mit Nullen aufgefüllt werden?
- In dem Extraktionsschema wird die Energie mit Summe(x^2) berechnet, in einem Band eines Frames steht aber doch immer nur ein einzelner Wert, warum dann die Summe?

Fragen über Fragen, ich hoffe ihr könnt mir etwas weiterhelfen
Angehängte Dateien
Dateityp: zip frames_194.zip (4,8 KB, 21x aufgerufen)
Gruß Schneider-Huetter
  Mit Zitat antworten Zitat