ich kann mich an ein Projekt erinnern, wo wir auch aus einer fremdsoftware die daten
mit ocr exportiert haben, weil der eigentliche softwarehersteller da irgendwas
selbstgestricktes zum speichern benutzt hatte und kein Bock drauf hatte, das die daten
zu einer anderen Plattform exportiert werden sollen, um ihn da so aus dem Projekt
rauszunehmen. seine Kunden zu erpressen hat sich aber nie bewährt ....
ich weiss noch das wir da eine minimal anwendung geschrieben haben, die den mausklick
auf den next button simuliert hat, der in der altsoftware im maximierten modus halt immer
an der selben position war, dann haben wir im hintergrund nircmd.exe gestart und hatten den
screen in einer png datei und im next step wurde dann tesseract aufgerufen um daraus einen
text zu generieren. (beides freie software
https://www.nirsoft.net/utils/nircmd.html
https://tesseract-ocr.github.io/tess...tallation.html, bei tesseract ggf -l deu
nicht vergessen weil sonst umlaute seltsam kommen).
nach einigen test wussten wir ganz grob wie lange das braucht und dann lief das ganz über
nacht durch und am nächsten tag hatten wir die kompletten inhalte aus der Maske als text
datei, zwar noch ziemlich seltsam strukturiert, aber das war dann simpel umsetzbar für die neue
db.
Der eigene pascal quelltext dafür war keine 30 zeilen lang und der Aufwand hielt sich in grenzen.
bei dem projekt ging es zwar nur um die Kundendatenmaske, die in der altsoftware relativ simpel
war, aber es waren mehr als 10000 records drin, daher war abtippen keine echte alternative.