Delphi-PRAXiS
Seite 1 von 2  1 2      

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Multimedia (https://www.delphipraxis.net/16-multimedia/)
-   -   FreePascal Grafiken erkennen. Library ? (https://www.delphipraxis.net/168095-grafiken-erkennen-library.html)

stiftII 4. Mai 2012 14:27

Grafiken erkennen. Library ?
 
Hallo,

ich müsste für ein Projekt Grafiken erkennen.

Das soll so funktionieren, dass die zu erkennende Grafik als .bmp eingelesen wird, und diese Grafik soll in einer anderen Grafik (zB auf dem Desktop) erkannt werden.

Das ganze soll auch funktionieren, wenn sich die Größe der gesuchten Grafik verändert.

Gibt es für diese Aufgabe irgendwelchen libs ?

Wie kann man so eine optische Erkennung am besten umsetzen.. TBitmap ist ja auch nicht alzu flexibel... und jeden Pixel einzeln auszulesen macht jetzt auch nicht viel Sinn und ist auch recht langsam !?

~stiftII

PS: Arbeite mit Lazarus

Jens01 4. Mai 2012 15:53

AW: Grafiken erkennen. Library ?
 
Zitat:

Gibt es für diese Aufgabe irgendwelchen libs ?
Also Graphics32 hat viele Tools, die Du gebrauchen kannst. Eine direkte Lösung wird das aber nicht sein.

Ansonsten finde ich oft hier was für solche Graphik-Sachen.

Zitat:

und jeden Pixel einzeln auszulesen macht jetzt auch nicht viel Sinn und ist auch recht langsam
Warum nicht?

freeway 4. Mai 2012 16:18

AW: Grafiken erkennen. Library ?
 
man kann jedes Pixel auslesen, man kann aber auch scanline verwenden (schneller)

shmia 4. Mai 2012 16:29

AW: Grafiken erkennen. Library ?
 
Zitat:

Zitat von freeway (Beitrag 1164904)
man kann jedes Pixel auslesen, man kann aber auch scanline verwenden (schneller)

Kommt drauf an, ob der Algorithmus es erlaubt sich im Bitmap horizontal zu bewegen.

Auf jeden Fall ist Pattern Matching sehr anspruchsvoll und übersteigt die Fähigkeiten eines "normalen Programmierers".

Codewalker 4. Mai 2012 17:22

AW: Grafiken erkennen. Library ?
 
Es muss nicht direkt pattern matching sein, es reicht ja eine Ähnlichkeitssuche. Das Schlagwort hier wäre "Korrelationsfunktion" (nicht die aus der Statistik, sondern die Umkehrung zur Convolution/Faltung in der Bildverarbeitung).
Leichte Kost ist das auch nicht gerade. Man sollte in der Lage sein, ein Bild per Fourier-Transformation (FFT) in den Frequenzraum zu transformieren (und wieder zurück) und auch komplexe Zahlen sollte einem nicht fremd sein. Zur Belohnung kann man dann ein kleineres Bild in einem größeren suchen und bekommt X- und Y-Koordinaten am Ende raus (als Maxima der Funktion, die die Ähnlichkeit der Bilder darstellt).
Zum schnellen Testen, kann man MatLab hernehmen:
Code:
functiong = dftcorr(f,w)
[M,N] = size(f);
F = fft2(f);
G = conj(fft2(w,M,N));
g = real(ifft2(G.*F));
gs= im2uint8(mat2gray(g));
figure; imtool(gs);
[I,J]= find(g == max(g(:)))
wobei hier w das gesuchte Muster und f das Gesamtbild ist. In I und J stehen dann nachher die Koordinaten (I=Y, J=X, weil Matlab spaltenweise arbeitet).
Das ganze in fertiger Form für Delphi kenne ich leider nicht, aber wenn dich das bisher nicht abgeschreckt hat: Zumindest zur Theorie dahinter hab ich noch ein wenig rumfliegen.

fkerber 4. Mai 2012 18:29

AW: Grafiken erkennen. Library ?
 
Hi,

die eierlegende Wollmilchsau zum Thema Bilderkennung etc. dürft vermutlich Bei Google suchenOpenCV sein...

LG, Frederic

stiftII 4. Mai 2012 18:37

AW: Grafiken erkennen. Library ?
 
Zitat:

Zitat von Codewalker (Beitrag 1164912)
Es muss nicht direkt pattern matching sein, es reicht ja eine Ähnlichkeitssuche. Das Schlagwort hier wäre "Korrelationsfunktion" (nicht die aus der Statistik, sondern die Umkehrung zur Convolution/Faltung in der Bildverarbeitung).
Leichte Kost ist das auch nicht gerade. Man sollte in der Lage sein, ein Bild per Fourier-Transformation (FFT) in den Frequenzraum zu transformieren (und wieder zurück) und auch komplexe Zahlen sollte einem nicht fremd sein. Zur Belohnung kann man dann ein kleineres Bild in einem größeren suchen und bekommt X- und Y-Koordinaten am Ende raus (als Maxima der Funktion, die die Ähnlichkeit der Bilder darstellt).
Zum schnellen Testen, kann man MatLab hernehmen:
Code:
functiong = dftcorr(f,w)
[M,N] = size(f);
F = fft2(f);
G = conj(fft2(w,M,N));
g = real(ifft2(G.*F));
gs= im2uint8(mat2gray(g));
figure; imtool(gs);
[I,J]= find(g == max(g(:)))
wobei hier w das gesuchte Muster und f das Gesamtbild ist. In I und J stehen dann nachher die Koordinaten (I=Y, J=X, weil Matlab spaltenweise arbeitet).
Das ganze in fertiger Form für Delphi kenne ich leider nicht, aber wenn dich das bisher nicht abgeschreckt hat: Zumindest zur Theorie dahinter hab ich noch ein wenig rumfliegen.

Das klingt ja schonmal genial :D...

Würde mich interessieren, was du noch so zum Thema hast. Und vllt kannste ja sogar eine Beispielfunktion in FPC basteln ??

Und was macht diese "Ähnlichkeitssuche" genau ?. Wandelt sie das Bild in ein verainfachtes Format um, und vergleicht gefundene Muster und formen ? Oder geht die im Endeffekte jeden Pixel durch und vergleicht ?

Danke schonmal.

~stiftII

stiftII 4. Mai 2012 18:46

AW: Grafiken erkennen. Library ?
 
Zitat:

Zitat von fkerber (Beitrag 1164919)
Hi,

die eierlegende Wollmilchsau zum Thema Bilderkennung etc. dürft vermutlich Bei Google suchenOpenCV sein...

LG, Frederic

Das klingt auch klasse.. Aber so wie ich das sehe gibt es keine fpc implementation.

Würde das ganze gerne in Lazarus umsetzen.

Aphton 4. Mai 2012 19:42

AW: Grafiken erkennen. Library ?
 
Wie performant muss das ganze sein, wo willst du es genau einsetzen?
Darf das gesuchte Bild Abweichungen haben oder ist es exakt so im Bild enthalten?

himitsu 4. Mai 2012 21:40

AW: Grafiken erkennen. Library ?
 
Zitat:

Zitat von shmia (Beitrag 1164907)
Zitat:

Zitat von freeway (Beitrag 1164904)
man kann jedes Pixel auslesen, man kann aber auch scanline verwenden (schneller)

Kommt drauf an, ob der Algorithmus es erlaubt sich im Bitmap horizontal zu bewegen.

Auch bei Scanline kann man ist man nicht auf eine horizontale Bearbeitung beschränkt.

- vorher in einem Pointer-Array alle Scanlines zwischenspeichern und schon hat man eine Art zweidimensionales Array

- sich den Zeiger auf die letzte Scanline holen (diese Bitmaps werden von unten nach oben gespeichert) und schon kann man über eine Art eindimensionales Array drauf zugreifen (alle Zeilen hintereinander)


Alle Zeitangaben in WEZ +1. Es ist jetzt 10:55 Uhr.
Seite 1 von 2  1 2      

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz