AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Projekte Normalisierung von Adressen / Postalman
Thema durchsuchen
Ansicht
Themen-Optionen

Normalisierung von Adressen / Postalman

Ein Thema von hanvas · begonnen am 19. Sep 2023 · letzter Beitrag vom 21. Sep 2023
Antwort Antwort
Seite 1 von 2  1 2      
BlueStarHH
Online

Registriert seit: 28. Mär 2005
Ort: Hamburg
868 Beiträge
 
Delphi 11 Alexandria
 
#1

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 15:33
Danke, das liest sich interessant. Was muss ich unter "Data directory" einstellen? Wenn ich das Projekt aus Delphi starte erscheint, diese Meldung:

Zitat:
Im Projekt TestPostal.exe ist eine Exception der Klasse Exception mit der Meldung 'libpostalostalman setup error' aufgetreten.
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.561 Beiträge
 
Delphi 12 Athens
 
#2

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 15:48
Vor 'ner Weile (dachte hier, aber vielleicht auch wo anders) eine Diskussion / Artikel gesehn, wo es darum ging ein Sprachmodel (ähnlich, wie man es von ChatGPT kennt) dafür zu nutzen.

Also das war es schon beeinruckend, was damit alles möglich ist.
Ein Therapeut entspricht 1024 Gigapeut.
  Mit Zitat antworten Zitat
hanvas

Registriert seit: 28. Okt 2010
177 Beiträge
 
Delphi 11 Alexandria
 
#3

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 17:32
Vor 'ner Weile (dachte hier, aber vielleicht auch wo anders) eine Diskussion / Artikel gesehn, wo es darum ging ein Sprachmodel (ähnlich, wie man es von ChatGPT kennt) dafür zu nutzen.

Also das war es schon beeinruckend, was damit alles möglich ist.
Im Grunde ist das der Hintergrund von libpostal. Allerdings ist es kein Sprachmodel. Trainiert wurde das Modell überwiegend mit den Daten von Openstreetmap, aber natürlich sind auch alternative Ansätze möglich. Das ist auch der Grund warum man die rund 1,5 gb Daten benötigt. Es funktioniert erstaunlich gut, ist recht zuverlässig und in gewisser Weise schreibweisentolerant.

Aber damit habe ich nichts zu tun, die Arbeit und auch ein (Python) Modul zum Deduplizieren [1] von Adressen (das eine oder andere werde ich noch einbauen) haben die Macher von libpostal gemacht. Ich will, wenn ich irgendwann mit dem Training fertig bin, libpostal eigentlich einsetzen um mit Hilfe von Donut [2] Rechnungen zu parsen und anschließend die Adressen aufzuarbeiten.

cu Ha Joe

[1] https://github.com/openvenues/lieu
[2] https://github.com/clovaai/donut
  Mit Zitat antworten Zitat
BlueStarHH
Online

Registriert seit: 28. Mär 2005
Ort: Hamburg
868 Beiträge
 
Delphi 11 Alexandria
 
#4

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 18:36
Ich habe die ZIP-Datei geladen und nach "C:\Workbench\" entpackt. Dann klappt es.

Entpacke ich die ZIP-Datei hingegen z.B. nach "C:\WorkbenchX\" und stelle im Programm folgendes ein:

Path to libpostal: C:\WorkbenchX\libpostal\src\.libs\libpostal-1.dll
Data directory: C:\WorkbenchX\libpostal
oder C:\WorkbenchX\libpostal\datastore
oder C:\WorkbenchX\libpostal\Data

Erscheint dieser Fehler:

Im Projekt TestPostal.exe ist eine Exception der Klasse Exception mit der Meldung 'libpostalostalman setup error' aufgetreten.

Was mache ich falsch?
  Mit Zitat antworten Zitat
hanvas

Registriert seit: 28. Okt 2010
177 Beiträge
 
Delphi 11 Alexandria
 
#5

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 18:47
Ich habe die ZIP-Datei geladen und nach "C:\Workbench\" entpackt. Dann klappt es.
Schön

Was mache ich falsch?
Sollte eigentlich gehen, ich schaue mir das später an und melde mich dann.
  Mit Zitat antworten Zitat
hanvas

Registriert seit: 28. Okt 2010
177 Beiträge
 
Delphi 11 Alexandria
 
#6

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 20:27
Was mache ich falsch?
Gar nichts, war mein Fehler.

In der Routine TPostalMan.Setup hat ein API Aufruf zum Setzen des Datenverzeichnisses gefehlt.

Hinweis: Wer nur die Headerdatei verwendet und das Datenverzeichnis verändern will muss erst das Datenverzeichnis setzen (libpostal_setup_datadir) bevor setup (libpostal_setup) aufgerufen wird.

Hab die entsprechende Datei (Postal.PostalMan) auf github geändert.

ps.: bei C:\Workbench\libpostal ist das Datenverzeichnis C:\Workbench\libpostal\datastore\libpostal, bei C:\WorkbenchX\libpostal ist das Datenverzeichnis entsprechend C:\WorkbenchX\libpostal\datastore\libpostal, natürlich können die Daten unterhalb von C:\Workbench\libpostal\datastore\libpostal aber auch in ein anderes Verzeichnis kopiert werden und dann muss eben das als Datenverzeichnis verwendet werden.

hth Ha Joe

Geändert von hanvas (20. Sep 2023 um 20:31 Uhr)
  Mit Zitat antworten Zitat
hanvas

Registriert seit: 28. Okt 2010
177 Beiträge
 
Delphi 11 Alexandria
 
#7

AW: Normalisierung von Adressen / Postalman

  Alt 21. Sep 2023, 10:41
Was mache ich falsch?
Gar nichts, war mein Fehler.
Nicht nur.

Ich habe libpostal noch mal selbst gebaut. Wenn ich die selbst gebauten Binaries/Datenverzeichnisse verwende kann ich libpostal an jede beliebige Stelle kopieren, wenn ich die "vorbereiteten" verwende bin ich tatsächlich auf den Pfad C:\Workbench... festgelegt. Es scheint so als ob der Author von pypostalwin an irgendeiner Stelle den Pfad/Pfade fest verdrahtet hätte.

Ich werde versuchen die Binaries auf Github in den ächsten Tagen zur Verfügung zu stellen, muss dazu aber ein Release basteln (wegen der Dateigröße) bis dahin wirst Du wohl mit der Lösung "C:\Workbench" auskommen müssen oder die Binaries selbst bauen. Die Anleitung dazu findest du bei libpostal.

cu Ha Joe
  Mit Zitat antworten Zitat
hanvas

Registriert seit: 28. Okt 2010
177 Beiträge
 
Delphi 11 Alexandria
 
#8

AW: Normalisierung von Adressen / Postalman

  Alt 21. Sep 2023, 12:58
Ich habe libpostal noch mal selbst gebaut....
Ich werde versuchen die Binaries auf Github in den ächsten Tagen zur Verfügung zu stellen
Ich habe die Daten mit der Testanwendung als Release auf Github gestellt. Einfach in ein beliebiges Verzeichnis entpacken und die Testanwendung ausführen. Die Pfade für die DLL und das Datenverzeichnis werden in dem Fall automatisch, beim starten der Testanwendung gesetzt.

hth Ha-Jö
  Mit Zitat antworten Zitat
BlueStarHH
Online

Registriert seit: 28. Mär 2005
Ort: Hamburg
868 Beiträge
 
Delphi 11 Alexandria
 
#9

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 18:39
Ich will, wenn ich irgendwann mit dem Training fertig bin, libpostal eigentlich einsetzen um mit Hilfe von Donut [2] Rechnungen zu parsen und anschließend die Adressen aufzuarbeiten.
Wozu braucht man die Adressen von Rechnungen? Wenn ich eine Rechnung ausstelle, kenn ich die Adresse, da ich sie selbst draufgeschrieben haben. Wenn ich eine Rechnung empfange, kenne ich die Adresse auch. Denn es ist meine eigene.
  Mit Zitat antworten Zitat
Benutzerbild von himitsu
himitsu

Registriert seit: 11. Okt 2003
Ort: Elbflorenz
44.561 Beiträge
 
Delphi 12 Athens
 
#10

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 18:44
Wenn ich eine Rechnung empfange, kenne ich die Adresse auch. Denn es ist meine eigene.
Auch die vom Absender?

Oder wenn du in deinen Daten nach einer Adresse suchst, sie aber nicht findest, weil sie anders gespeichert ist.
Ein Therapeut entspricht 1024 Gigapeut.
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 2  1 2      

 

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 19:27 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz