Einzelnen Beitrag anzeigen

kalmi01
(Gast)

n/a Beiträge
 
#10

Re: Hausnummern aus Adressfeldern (Strassen) extrahieren

  Alt 10. Jan 2006, 08:09
Hallo alzaimer,

Zitat:
Das Problem ist, das man meint, man schreibt -wupps- mal eben einen Parser und fertig. Leider ist dem nicht so.
Z.B. sind solche Fälle wie 'Wuselstr. 3-5 (Bei Kassupke)' auch nicht einfach
Ich habe vor kurzem ein ähnliches Problem gehabt, 500.000 ASCII-Dateien mit einer (theorethisch) genau definierten Struktur mit 160 Feldern in eine DB überführen.
Da die Daten aus 20 Jahren Datenerfassung stammten, waren sie alles, nur nicht konsistent.

Ich bin die Sache dann recht trivial angegangen, ich habe immer dann eine Exception ausgelöst, wenn irgendetwas im Datenbestand unklar war.
Die Entscheidung für eine Exception hab ich recht "scharf" eingestellt.
Anfangs lief das Prog nur einige Datensätze weit, dann PENG.
Aber nach kurzer Zeit musste ich nur ca. alle 10.000 Datensätze eingreifen.
Teilweise hab ich eine Softwarelösung für das Problem erstellt, in anderen Fällen hab ich mich für händische Korrektur entschieden.
Die theoretische Laufzeit wäre ca. 34 Std. gewesen, die reale betrug (mit Programmierarbeiten) ca. das 4-fache.
Für diesen Weg hatte ich mich entschieden, da ich bei einem anderen Projekt die Erfahrung gemacht hatte, dass es schnell passieren kann, dass man aus falschem Ehrgeiz leicht dazu neigt, alles per Prog zu erschlagen, selbst, wenn eine händische Korrektur schneller/effektiver wäre.
  Mit Zitat antworten Zitat