AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Projekte THashMap - einfache Hashmap-Implementation
Thema durchsuchen
Ansicht
Themen-Optionen

THashMap - einfache Hashmap-Implementation

Ein Thema von 3_of_8 · begonnen am 12. Aug 2007 · letzter Beitrag vom 26. Aug 2007
Antwort Antwort
Benutzerbild von 3_of_8
3_of_8
Registriert seit: 22. Mär 2005
Hallo,

Ich habe mal vor einiger Zeit eine Hashmap gebraucht und mir schnell eine implementiert. Da ich in der DP noch keine Implementation gefunden habe, habe ich mir gedacht, ich könnte die mal noch etwas verbessern und dann hier reinstellen.

Das Prinzip ist recht einfach: Man hat einen String als Schlüssel und einen Pointer als Wert (bei der THashMap). Ich habe gleich noch 2 abgeleitete Klassen mit reingepackt: Eine TObjectHashMap, die TObject-Instanzen verwaltet (und auf Wunsch, ähnlich wie die TObjectList, automatisch freigibt, wenn sie gelöscht werden oder die Hashmap freigegeben wird) und davon abgeleitet eine TStringHashmap, die über eine Wrapper-Klasse Strings enthalten kann.

Als Hash-Funktion verwende ich momentan den Adler32-Algorithmus, der allerdings keine sonderlich guten Ergebnisse zu bringen scheint, bei einem Füllungszustand von 50% sind gerade einmal 35% der Buckets gefüllt und die Kollisionsrate liegt dementsprechend bei etwa einer Kollision auf 3,5 Werte. (knapp 30%)

Wenn jemand einen Verbesserungsvorschlag hat, nur her damit!
Angehängte Dateien
Dateityp: pas hashmap_158.pas (7,1 KB, 104x aufgerufen)
„The trouble with having an open mind, of course, is that people will insist on coming along and trying to put things in it.“
- Terry Pratchett
 
Benutzerbild von 3_of_8
3_of_8

 
Turbo Delphi für Win32
 
#2
  Alt 13. Aug 2007, 21:14
*hüstel* *push*
Manuel Eberl
  Mit Zitat antworten Zitat
Benutzerbild von St.Pauli
St.Pauli

 
Delphi 7 Personal
 
#3
  Alt 20. Aug 2007, 11:47
Probier es doch mal mit einer kryptographischen Hash-Funktion. Deren Aufgabe ist es, Kollisionen möglichst zu vermeiden.
  Mit Zitat antworten Zitat
Benutzerbild von 3_of_8
3_of_8

 
Turbo Delphi für Win32
 
#4
  Alt 20. Aug 2007, 18:37
Das wäre äußerst ineffizient. Erstens wäre das deutlich langsamer und zweitens wäre die Effizienz der Hashfunktion mit der geringen Bucket-Zahl nicht wirklich genutzt.
Manuel Eberl
  Mit Zitat antworten Zitat
Dax
 
#5
  Alt 20. Aug 2007, 19:11
Du könntest immer 4 Chars als ein Integer verXORen, aber ob das so viel mehr bringt als zb MD4?
  Mit Zitat antworten Zitat
alzaimar

 
Delphi 2007 Enterprise
 
#6
  Alt 26. Aug 2007, 08:50
In meiner Implementierung verwende ich ELF-Hashing. Vorher hatte ich (wegen Faulheit) ein CRC-32 Hash eingebaut (lag bei mir rum), der aber ineffizient ist. Mit ELF habe ich die besten Erfahrungen gemacht. Ich hatte einige Funktionen ergoogelt, verschiedene Hashmaps gebastelt und den schnellsten Kandidaten benutzt.

Meine Implementierung (bei der Du dich ggf gerne bedienen kannst) verwendet eine Prim-Mapgröße und verdoppelt die Größe auf die nächsthöhere Primzahl, wenn der Füllstand 80% beträgt. Damit habe ich für meinen Anwendungsfall (Codegenerator und Compiler) ausreichend gute Ergebnisse erzielt. Einige Geeks schwören auf eine Vergrößerung um 1,67 (goldener Schnitt), oder haben sogar 'magische Map-Größen' ermittelt. Das ist imho Quatsch, denn es hat bei mir keine Verbesserung gebracht: Eher das Gegenteil. Einzig die Wahl der nächsten Mapgröße (eine Primzahl) scheint Einfluss auf die Performance zu haben: Es gibt im Zusammenspiel mit der Hashfunktion bestimmte Mapgrößen, die bezüglich der Kollisionsanzahl deutlich schlechter sind, als die nächsthöhere/niedrigere. Ich habe jedoch keine Möglichkeit gefunden, dies zu optimieren. Ergo ist es 'Pech', wenn bei bestimmten Schlüsseln und Mapgrößen die Performance um z.T. mehr als 10% einbricht: Ein Beinbruch ist es jedoch nicht, denn schnell genug sind die Dinger allemal.

Wenn deine Hashmap beliebige Strings als Schlüssel akzeptiert (die also keine besonderen Syntax genügen), kann es eine optimale Hashfunktion nicht geben. CRC32/ADLER wird Schlüssel der Form 'S1','S2' etc. vermutlich am besten hashen, weil sie genau dafür konzipiert wurden: Die Hashwerte ähnlicher Informationen weit zu streuen. Wie sich diese Verfahren bei zufälligen Strings verhalten, ist aber nicht vorhersehbar. Insofern habe ich mich auf schnelle und im Compilerbau übliche Hashfunktionen konzentriert und eine möglichst Performante gesucht.

Weiterhin gibt es eine Hashmap bei den Jedis (JCL), die Du dir mal anschauen kannst. Sie verwenden einen interessanten Hashing-Algorithmus (PJW), der bei mir dem ELF knapp unterlegen war. Letztendlich würde ich mit einem Strategy-Muster die Funktion ermitteln, die für deinen Anwendungsfall die besten Ergebnisse erzielt.
  Mit Zitat antworten Zitat
Benutzerbild von 3_of_8
3_of_8

 
Turbo Delphi für Win32
 
#7
  Alt 26. Aug 2007, 09:17
Interessant. Ich lasse bis jetzt immer den User (bzw. den, der die Hashmap erzeugt) die Bucket-Anzahl bestimmen, habe aber eine Primzahl als Standardgröße verwendet. An automatische Erweiterung habe ich auch schon gedacht. Danke.
Manuel Eberl
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 21:45 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz