AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Projekte Normalisierung von Adressen / Postalman
Thema durchsuchen
Ansicht
Themen-Optionen

Normalisierung von Adressen / Postalman

Ein Thema von hanvas · begonnen am 19. Sep 2023 · letzter Beitrag vom 21. Sep 2023
 
hanvas

Registriert seit: 28. Okt 2010
177 Beiträge
 
Delphi 11 Alexandria
 
#4

AW: Normalisierung von Adressen / Postalman

  Alt 20. Sep 2023, 17:32
Vor 'ner Weile (dachte hier, aber vielleicht auch wo anders) eine Diskussion / Artikel gesehn, wo es darum ging ein Sprachmodel (ähnlich, wie man es von ChatGPT kennt) dafür zu nutzen.

Also das war es schon beeinruckend, was damit alles möglich ist.
Im Grunde ist das der Hintergrund von libpostal. Allerdings ist es kein Sprachmodel. Trainiert wurde das Modell überwiegend mit den Daten von Openstreetmap, aber natürlich sind auch alternative Ansätze möglich. Das ist auch der Grund warum man die rund 1,5 gb Daten benötigt. Es funktioniert erstaunlich gut, ist recht zuverlässig und in gewisser Weise schreibweisentolerant.

Aber damit habe ich nichts zu tun, die Arbeit und auch ein (Python) Modul zum Deduplizieren [1] von Adressen (das eine oder andere werde ich noch einbauen) haben die Macher von libpostal gemacht. Ich will, wenn ich irgendwann mit dem Training fertig bin, libpostal eigentlich einsetzen um mit Hilfe von Donut [2] Rechnungen zu parsen und anschließend die Adressen aufzuarbeiten.

cu Ha Joe

[1] https://github.com/openvenues/lieu
[2] https://github.com/clovaai/donut
  Mit Zitat antworten Zitat
 

 

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 20:08 Uhr.
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz