![]() |
Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar
Vielen Dank moebak, das ist wirklich der erste vernünftige Artikel, den ich zu diesem Thema gelesen habe! Ich habe mich mangels Informationen kaum noch mit dem Thema befasst, aber nun werde ich wohl wieder einsteigen. Ein wirklich erstklassiger Artikel...
|
Re: Grundsätzliche Funktionsweise von Musikerkennungssoftwar
Liste der Anhänge anzeigen (Anzahl: 1)
Hallo,
beim näheren Durchlesen des Artikels haben sich doch noch einige Fragen ergeben, v.a. beim Einteilen in die Frames und beim Gewichten mit dem Hanning-Fenster bin ich mir nicht ganz sicher, ob ich es richtig verstanden habe. Ich habe mal 2 Graphiken angehängt, die zeigen, wie ich mir das Ganze vorstelle. Bei folgenden Punkten bin ich mir noch unsicher: - Ist das Aufteilen der Frames so richtig, wie ich es in den angehängten Graphiken eingezeichnet habe? - Wird das Hanning-Fenster einfach über jeden Frame gelegt und ist genau so breit wie ein Frame? - wenn ein Frame 0,37s lang ist, müsste dieser bei 5kHz doch 1850 Samples (0,37 s *5000 Hz), und nicht wie angegeben 2048 Samples enthalten. Kommt die 2048 vielleicht von der FFT, da man hier ja nur 2er-Potenzen verwenden sollte? Müssen die fehlenden 198 Samples dann mit Nullen aufgefüllt werden? - In dem Extraktionsschema wird die Energie mit Summe(x^2) berechnet, in einem Band eines Frames steht aber doch immer nur ein einzelner Wert, warum dann die Summe? Fragen über Fragen, ich hoffe ihr könnt mir etwas weiterhelfen :gruebel: |
Alle Zeitangaben in WEZ +1. Es ist jetzt 16:18 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz