Delphi-PRAXiS
Seite 4 von 4   « Erste     234   

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Multimedia (https://www.delphipraxis.net/16-multimedia/)
-   -   Delphi Grundsätzliche Funktionsweise von Musikerkennungssoftware (https://www.delphipraxis.net/47520-grundsaetzliche-funktionsweise-von-musikerkennungssoftware.html)

Schneider-Huetter 8. Aug 2006 13:44

Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar
 
Vielen Dank moebak, das ist wirklich der erste vernünftige Artikel, den ich zu diesem Thema gelesen habe! Ich habe mich mangels Informationen kaum noch mit dem Thema befasst, aber nun werde ich wohl wieder einsteigen. Ein wirklich erstklassiger Artikel...

Schneider-Huetter 9. Aug 2006 13:06

Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar
 
Liste der Anhänge anzeigen (Anzahl: 1)
Hallo,
beim näheren Durchlesen des Artikels haben sich doch noch einige Fragen ergeben, v.a. beim Einteilen in die Frames und beim Gewichten mit dem Hanning-Fenster bin ich mir nicht ganz sicher, ob ich es richtig verstanden habe.
Ich habe mal 2 Graphiken angehängt, die zeigen, wie ich mir das Ganze vorstelle.
Bei folgenden Punkten bin ich mir noch unsicher:
- Ist das Aufteilen der Frames so richtig, wie ich es in den angehängten Graphiken eingezeichnet habe?
- Wird das Hanning-Fenster einfach über jeden Frame gelegt und ist genau so breit wie ein Frame?
- wenn ein Frame 0,37s lang ist, müsste dieser bei 5kHz doch 1850 Samples (0,37 s *5000 Hz), und nicht wie angegeben 2048 Samples enthalten. Kommt die 2048 vielleicht von der FFT, da man hier ja nur 2er-Potenzen verwenden sollte? Müssen die fehlenden 198 Samples dann mit Nullen aufgefüllt werden?
- In dem Extraktionsschema wird die Energie mit Summe(x^2) berechnet, in einem Band eines Frames steht aber doch immer nur ein einzelner Wert, warum dann die Summe?

Fragen über Fragen, ich hoffe ihr könnt mir etwas weiterhelfen :gruebel:


Alle Zeitangaben in WEZ +1. Es ist jetzt 06:44 Uhr.
Seite 4 von 4   « Erste     234   

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz