Forum: Algorithmen, Datenstrukturen und Klassendesign
by jobo,
12. Jun 2018
Ich habe den TE bzw. den notwendigen Ablauf so verstanden, dass er nur matchen muss und keine Änderungen an den Adressen vornimmt. Das Ergebnis einesAbgleichs wäre Kunde x von unserem Kunden a ist auch|nicht unser direkter Kunde.
Aber das wird der TE sicher selbst am besten wissen.
Forum: Algorithmen, Datenstrukturen und Klassendesign
by jobo,
11. Jun 2018
Na da freu ich mich doch wieder mal, dass ich nicht im "Örtlichen" stehe.
M.E. ging es nicht um Validierung, sondern um Dublettenfindung bzw. Matches.
Dafür ist eine Validierung nicht nötig. Wenn bspw. ständig falsche Daten irgendwo gekauft werden (und importiert und weiterverarbeitet werden), macht es eine zusätzliche Validierung (die gegen unterschiedliche Optimierungsstände läuft) nur...
Forum: Algorithmen, Datenstrukturen und Klassendesign
by jobo,
11. Jun 2018
Harte Fakten wären wohl Adressgleichheit und (Tele)Phone Nummer (mit Ungenauigkeit)
Dann Ansprechpartner, ggF. auch Firmenname (sofern aktualisiert nach Zusammenführung, aber wer weiß das schon).
Für den ungenauen Vergleich bieten sich phonetische Algos und sowas wie levenshtein Distnanz an. Ich würde die Vergleiche je Informations Gruppe laufen lassen und Ratings bilden. Dann testen und...