![]() |
Musikanalyse - Was sagen mir die Werte?
Liste der Anhänge anzeigen (Anzahl: 5)
Bezug nimmt dieser Thread auf den Thread "
![]() Sodila, weiter gehts. :) Ich habe mich jetzt die letzten Tage mal hingesetzt und eine Klasse geschrieben, die die PCM-Daten aus Audiodateien auslesen kann, diese einer Fourier-Analyse unterzieht und anschließend ein (logarithmisches) Spektogramm ausgibt. Meine Idee ist, die spektografische Analyse einer Musikdatei zu untersuchen. Derzeit bin ich am experimentieren, was ich mit den Werten anfangen kann. So addiere ich bspw die (logarithmierten) Werte aller Samples zusammen und teile diesen Wert dann durch die Anzahl der Samples * 10000. So bekomme ich einen Wert, der mir (meiner Meinung nach) etwas über die subjektive Lautheit eines Tracks sagt. So hat bspw "American Idiot" von "Green Day" einen sechs mal höheren Wert als "Hallelujah" von "Jeff Buckley". Das kann aber auch kompletter Zufall sein. Allerdings hat der Sound einer Bombenexplosion einen zehnmal höheren Wert als "Hallelujah". :) Was mir noch fehlt, sind Möglichkeiten, die Geschwindigkeit eines Liedes zu bestimmen. Kann ich mich da nur auf die Beats Per Minute verlassen? Eher nicht, denn "Der Hummelflug" hat, auf der Geige gespielt, vermutlich recht wenig messbare Beats Per Minute - trotzdem ist das Ding verdammt schnell. ;) Was könnte man also tun? Man könnte bspw. in den höheren Frequenzen nach mehreren Samples hintereinander suchen, die ungefähr einen ähnlichen Wert haben. Dies würde bedeuten (imho), das hier ein Ton recht lange gehalten wird, was ja meist ein Indiz für ein langsames, trauriges Lied ist (imho). Ich habe euch mal ein paar Spektogramme vorbereitet: Anhang 32427 Clueso - Gewinner Anhang 32428 Dire Straits - Brothers in Arms Anhang 32429 Eminem feat. Rihanna - Love The Way You Lie Anhang 32430 Hurts - Wonderful Life Anhang 32431 Jeff Buckley - Hallelujah Alles in allem - was meint ihr dazu? |
AW: Musikanalyse - Was sagen mir die Werte?
Die Lautstärke absolut betrachtet bringt eigentlich nichts, denn dann würde es davon abhängen, wie die Aufnahme ausgesteuert bzw. für die jeweilige Veröffentlichung abgemischt wurde.
Je nach Ausgabe (LP, Single, Sampler) ist das gleiche Lied anders ausgesteuert und würde völlig andere Werte ergeben. Besser wäre es den Dynamik-Umfang zu nehmen, obwohl auch an diesen Werten für die jeweilige Ausgabe gedreht wird. Versuche doch eine Aufteilung in Zeitabschnitte (z.B. 10sec) und Frequenzbereiche (0-100, 100-500, usw.) und ermittele dafür jeweils den Dynamikumfang. Von diesen Teilen bildest du dann den Mittelwert für die jeweiligen Frequenzbereiche sowie Min und Max. Ein weiteres Kriterium könnte auch der zeitliche Abstand zwischen einem Peak und "Stille" und auch da einen Mittelwert zu bilden. |
AW: Musikanalyse - Was sagen mir die Werte?
Wie komme ich denn an die Werte für den Dynamikumfang? :gruebel: Oder anders gefragt: Was ist der Dynamikumfang? Wikipedia sagt:
Zitat:
|
AW: Musikanalyse - Was sagen mir die Werte?
Dynamik bei Musik ist der Unterschied zwischen der leisesten und lautesten Passage.
Eine gute Bolera-Aufnahme die man direkt am Anfang gut aus den Boxen kommt, zerfetzt dir zum Schluss die Kalotten. Dafür gibt es dann aber wieder einen Dynamik-Kompressor, der die leisen Passagen lauter macht und die lauten leiser. Sinnvoll, wenn man sich von der Musik berieseln lassen und keinen Schockeffekt gebrauchen kann. Ansonsten audiophil ein NoGo |
AW: Musikanalyse - Was sagen mir die Werte?
Liste der Anhänge anzeigen (Anzahl: 1)
Ich stehe ja mehr auf konkrete Dinge (Sourcecode) und nicht nur auf Bilder...
|
AW: Musikanalyse - Was sagen mir die Werte?
Lautheit und Dynamik kannst du imo beides vergessen, weil die, wie bereits gesagt wurde, bei jeder Ausgabe unterschiedlich sind (siehe auch
![]() ![]() Das war jetzt natürlich alles stark vereinfacht dargestellt, was auch daran liegt, dass ich selbst praktisch keine Ahnung davon habe. Vielleicht findest du bei ReplayGain trotzdem ein paar Ansätze, die du gebrauchen kannst, denn es werden ja ![]() |
AW: Musikanalyse - Was sagen mir die Werte?
Hm, naja. Ich habe mir MP3Gain heruntergeladen. Ein Track wurde um 3 dB angepasst. Wie zu erwarten war, hat sich der von mir errechnete Durchschnittswert um 2 Punkte verändert. Bei einer Skala von 0 bis 100 ist das, zugegebenermaßen, nicht viel. Hat vielleicht jemand zufällig einen Track, bei dem MP3Gain noch agressiver zuschlagen muss? Mich würden mal Vergleichswerte interessieren.
@Omata: Danke für den QT. :) Ich veröffentliche meinen, sobald er a) vernünftig implementiert ist und b) die neue Version von SmallTune fertig ist. :) //Edit: Die Spektogramme sind übrigens immernoch fast identisch. Hätte mich auch gewundert, wenn nicht. :) Die Dynamik-Analyse von Sir Rufo habe ich noch nicht implementiert. Ggf. müsste man hier noch ein wenig mit der Mathematik spielen. |
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
Konkretes Beispiel aus meiner Playlist: "Holy Wars...The Punishment Due" vom Album "Rust in Peace" von Megadeth: Original von 1990: -2.57dB Remastered von 2004: -10.06dB |
AW: Musikanalyse - Was sagen mir die Werte?
Liste der Anhänge anzeigen (Anzahl: 2)
Ok, nun habe ich sehr deutlich gesehen, was du meinst: Der Wert (= Durchschnitt aller Samples) der remasterten Version ist dreimal so groß wie der des Originals. Was mich wieder zum Ausgangspunkt zurück führt: Was für Werte sollte ich analysieren?
Wenn man sich die beiden Spektogramme ansieht, erkennt man ja durchaus charakteristische Eigenschaften: Anhang 32435 Remastered Anhang 32436 Original (Ich bin kein Musiker, von daher hab ich so mit den Fachtermini meine Probleme. :stupid: ) Wenn man bspw. die niedrigen Frequenzen betrachtet, fällt eine Art "Basslinie" auf. Generell fällt auf, dass die Werte über alle Frequenzen stark fluktuieren. Man erkennt sogar, dass ab dem 2. Fünftel des Liedes eine Stimme einsetzt. Betrachtet man die schnellen Änderungen der Amplituden, kann man eigentlich sagen, dass es sich um ein recht schnelles Lied handelt, das, aufgrund der "gefüllten" Frequenzbänder, auch einen recht "lauten" Eindruck macht. (Laut = Lautheit != Lautstärke). Ich hoffe, dass war so ein bisschen verständlich, was ich damit sagen wollte. Wie gesagt, auch ich bin ein absoluter Laie... |
AW: Musikanalyse - Was sagen mir die Werte?
Sodila - *hust* - kleiner Durchbruch.
Ich habe noch etwas weiter gegraben, und bin in meiner Browserhistory auf ![]() Sollte ich Erfolg haben, poste ichs hier. Wenn nicht, dann auch. :mrgreen: |
AW: Musikanalyse - Was sagen mir die Werte?
Vielleicht ist für dich noch
![]() |
AW: Musikanalyse - Was sagen mir die Werte?
Danke, dass Ding kenne ich schon. Es nutzt die AudioID-Technik des Frauenhofer Instituts. Und wirklich herausfinden, wie es funktioniert, war mich bislang nicht möglich. Dennoch danke für den Hinweis. ;)
|
AW: Musikanalyse - Was sagen mir die Werte?
Liste der Anhänge anzeigen (Anzahl: 1)
Hmm - irgendwie sind meine Mathekenntnisse arg beschränkt.
Basierend auf ![]() ![]() Zitat: Zitat:
Das Projekt muss kompilliert werden, bevor es genutzt werden kann, da ihr im Quelltext die Pfade zu zwei Musikdateien angeben müsst - njoar, und dann braucht ihr zwischen 2 und 3 Minuten Geduld, um einen Wert zu bekommen, der irgendwie nixsagend ist... :gruebel: |
AW: Musikanalyse - Was sagen mir die Werte?
Liste der Anhänge anzeigen (Anzahl: 4)
Yes!
*hust* :mrgreen: Meine Implementation des MIRAGE-Plugins ist fertig. Das Testprogramm ist kompiliert und verlangt die Auswahl zweier Lieder. Das Programm unterstützt noch kein Threading, daher friert die Anwendung ein. Der ganze Vorgang dauert auf meinem Core2Duo mit 1.66 Ghz nur 5 - 10 Sekunden. Wichtig: Das Lied muss länger als 2 Minuten sein. Alles andere wird noch nicht geprüft. Als Ergebnis bekommt ihr einen Wert. Je kleiner der Wert ist, desto näher sind sich die beiden Lieder. Zwischen 0 und 10 bedeutet, dass sich die Lieder recht ähnlich sind. Werte größer >50 stehen für komplett unterschiedliche Lieder. Angehängt hab ich euch das kompillierte .NET-Projekt sowie den Visual Studio 2010 Source. Es wird .NET Version 4 vorausgesetzt. //Edit: Nochmal zwei Beispiele für euch: Hurts - Wonderful Life vs. B.O.B - Airplanes Anhang 32615 Jeff Buckley - Hallelujah vs. Megadeth - The Punishment Due Anhang 32614 |
AW: Musikanalyse - Was sagen mir die Werte?
Stichprobenartig sieht das gut aus, zumindest wird Ähnlichkeit gut erkannt.
Manche scheinen aber zu ähnlich bewertet zu werden, obwohl sie vom Stil relativ unterschiedlich sind: Wert: 9,349607 ![]() ![]() Wert: 7,148081 ![]() ![]() |
AW: Musikanalyse - Was sagen mir die Werte?
Hab's gerade mal an ein paar Liedern getestet. Also grob scheint die Einschätzung des Programms meist zu stimmen. Allerdings hatten bei mir zwei verschiedene Lieder einen Albums einen geringeren Abstand (2,irgendwas) als zwei mal das selbe Lied von einmal Original und einmal Remastered (5,irgendwas).
Aber solange man die Werte mit Schwellenwerten von 5-10 vergleicht, denke ich, ist der Algorithmus durchaus brauchbar. Wenn ich mich nicht irre, geht es dir ja eh nur um eine grobe Vorsortierung, da die ursprüngliche Idee ja war, dass das Programm aus dem Nutzerverhalten lernt. Wobei es natürlich auch bei recht schnellen 5-6 Sekunden, die der Algorithmus braucht, nicht praktikabel ist, eine komplette Musiksammlung auf diese Weise zu scannen. Da müsste man sich wohl noch irgendeine Optimierungsstrategie überlegen (z.B. nur stichprobenartig zu scannen und den Rest zu interpolieren, also z.B. wenn bekannt ist: A ist ähnlich zu B, und B ist ähnlich zu C; dann ist A vermutlich auch ein bisschen ähnlich zu C. Aber wahrscheinlich hast du dir dazu auch schon Gedanken gemacht... |
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
Das ist etwas, das kann man imho im Hintergrund berechnen lassen, das sollte nicht das Problem sein. Es wird eine Trefferwahrscheinlichkeit von 75 - 80% angegeben. Die Differenzen können recht schnell berechnet werden. Also alles im machbaren Bereich. ;) BUG, das Lied ist natürlich sehr - speziell. :mrgreen: Ich werde mir das mal ansehen, vielleicht kann man da noch was optimieren. ;) |
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
|
AW: Musikanalyse - Was sagen mir die Werte?
Du musst schon bei der Zeitberechnung bedenken, dass du immer paarweise Vergleiche hast ;). Das ist dann O(n*(n+1)/2), und bei 100 Liedern schon 3sek*100*(101/2) = 15150 sek = 252,5 min ~= 4,21 std.
|
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
Damit liegt der Zeitgewinn bei einigen wenigen Liedern natürlich bei 0. Je mehr du aber hast, desto mehr Zeit gewinnst du gegenüber einem Vergleich mit allen Liedern. |
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
Also sorry, aber dein Argument erschließt sich mir nicht wirklich. Vielleicht kannst du das nochmal für doofe (also mich) erklären. |
AW: Musikanalyse - Was sagen mir die Werte?
Man kann eventuell davon ausgehen, dass wenn Lied1 zu Lied2 ähnlich ist und Lied2 zu Lied3 ähnlich ist, auch Lied1 zu Lied3 ähnlich ist. Wenn man das weiß, braucht man nicht zu prüfen, ob Lied1 auch zu Lied3 ähnlich ist. Wenn man jetzt eine Gruppe von Liedern hat, die sich ähnlich sind, dann braucht man, um herauszufinden, zu welchen Liedern ein neues Lied Y ist aus dieser Gruppe nur eines davon mit dem neuen Lied vergleichen.
Das ganze ist natürlich nur in gewissen Maßen praktikabel, aber ich denke das könnte in vielen Fällen gut gehen. |
AW: Musikanalyse - Was sagen mir die Werte?
Ähm, wenn ich #13 richtig verstanden habe, wird für jedes Musikstück so etwas wie ein "Fußabdruck" erstellt. Und je nachdem was er für eine Aussage beinhaltet können die Ähnlichkeiten durch simples Sortieren festgestellt werden. Zeit fällt also nur für das einmalige Einlesen an.
Gruß K-H |
AW: Musikanalyse - Was sagen mir die Werte?
Ich habe ein paar kleinigkeiten Ausprobiert:
ACDC - Thunderstruck vs Ich und Ich - So soll es bleiben Wert: 6,069492 ACDC - Thunderstruck vs ACDC - Who Made Who Wert: 6,664665 ACDC - Thunderstruck vs The White Strips - Offend in Every Way Wert: 6,495523 ACDC - Thunderstruck vs Silbermond - Meer sein Wert: 5,758114 ------------ Silbermond - Meer sein vs Ich und Ich - So soll es bleiben Wert: 13,36255 ----- Man kann also nicht davon ausgehen das sich die Lieder die zu einem Lied ähnlich sind, zu einander ähnlich ähnlich sind. Viele Grüße, Tobi |
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
![]() |
AW: Musikanalyse - Was sagen mir die Werte?
Zitat:
Highttower, danke für deine Testreihe. Man sieht, denke ich, gut, dass man nicht pauschal sagen kann, dass Lied1 ähnlich Lied3 ist, auf der anderen Seite ist der Abstand jetzt aber auch nicht sooooo groß... Hier sind sicherlich Optimierungen möglich/nötig. Zur Genauigkeit der Bestimmung des Fingerprints habe ich auch noch einzuwerfen, dass ich Stille am Anfang der Lieder noch nicht ignoriere. D.h., sollte man bspw. 5 Sekunden am Beginn nichts hören, fließt das auch in die Berechnung ein. Das kann natürlich die Ergebnisse verfälschen. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 18:59 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz