Hallo!
Um auf deine "wichtigste Frage" einzugehen...
"... wie bekomme ich aus einer solchen pdf die
xml daten heraus? und wie bekomme ich die pdf, die meine software eh schon erstellt, so ergänzt, das diese alle relevanten
xml dateien standardkonform enthält und trotzdem lesbar bleibt..."
...welche ich auch hatte...nutze ich aktuell "7-PDF Attach Extract And Remove". Es bietet einen CLI Mode den ich zum Anfügen von ZUGFeRD
XML Dateien verwenden kann.
https://www.7-pdf.de/produkte/pdf-at...act-and-remove
:: Datei anhängen:
PDFAttachExtractAndRemoveFiles.exe -mode "console" -usage "attach" -inpdf "rechnung.pdf" -infile "factur-x.xml" -estandard "ZF2"
Zum Extrahieren des ZUGFeRD XMLs aus PDF Dateien kann man diesen Befehl nutzen:
:: Datei extrahieren:
PDFAttachExtractAndRemoveFiles.exe -mode "console" -usage "extract" -inpdf "rechnung.pdf" -outpath "C:\Output" -fileext ".xml"
oder auch so:
:: Datei entfernen:
PDFAttachExtractAndRemoveFiles.exe -mode "console" -usage "remove" -inpdf "rechnung.pdf" -byName "factur-x.xml"
Neuerdings kann man auch PDF Rechnungen in PDF ZUGFeRD umwandeln:
:: PDF in ZUGFeRD konvertieren:
PDFAttachExtractAndRemoveFiles.exe -mode "console" -usage "generate" -inpdf "rechnung.pdf" -apiToken "IHR_TOKEN"
Dazu benötigt man aber einen
API Token auf "7-PDF Invoice Extractor" - einem KI gestützten Analyseservice der das
XML aus Rechnungsdaten erzeugt.
Mit der Beispielrechnung auf der Seite habe ich das schon mal getestet, und es funktioniert ... zumindest wenn das PDF ein PDF/A3-b ist.
Man kann das Ganze auch direkt in den Druck von PDF Rechnungen einbinden:
https://www.7-pdf.de/produkte/pdf-pr...-per-pdf-druck
Und eine FastAPI gibt es auch:
url -X POST
https://generator.7-pdf.de/extract-invoice/ \
-H "accept: application/json" \
-H "Authorization: Bearer [[ T O K E N - C O D E ]]" \
-H "Content-Type: multipart/form-data" \
-F "file=@/Users/benutzername/Documents/Invoice.pdf"
Aber wie brauchbar das ist, müsste man selbst mal testen...aktuell hab ich das Thema erst (noch) mal nach hinten geschoben.