Canny edge algorithmus und Sobel Matrix

**Gutelo**

Hallo,

Ich implementiere gerade ein Verfahren um Kannten in Bildern zu erkennen. Ablauf: Farbbild -> Graustufenbild -> Glaetten mit Gauss Matrix Kern -> Gradienten mittels Sobel Matrizen in x und y richtung > threshold -> non maximum reduction

Ein Problem habe ich bei den Sobel Matrizen. Die Faltung mit der Pixelmatrix mit den sobel matrizen liefert neben byte konformen werten auch negative werte. Im internet habe ich nirgends gefunden wie genau die beiden Einzelbilder aus den zwei Sobelmatrizen generiert werden. Diese Bilder werden oft separat gezeigt. Ausserdem zeigen meine errechneten Bilder keine klaren Kannten. Ich nehme an dass nach Anwendung der Sobelmatrizen der Farbraum neu skaliert wird und thresholds gesetzt werden. Ist das richtig? Wenn ja, wieso schreibt das kein Mensch. Auch steht ueberall dass die errechneten pixel normiert werden aber der normierungsfaktor fehlt generell bei sobel matrizen. Bei der gaussmatrix hingegen steht der triviale normierungsfaktor immer dabei.

Gutelo

**Gutelo**

Als Sobel Matrizen verwende ich:

markieren

Code:

			           (1   2  1)

G_Y = N_Y *(0   0  0)

           (-1 -2 -1)

            (1  0  -1)

G_X = N_X * (2  0  -2)

            (1  0  -1)

Die Normierungsfaktoren N_Y und N_X werden selten angegeben. Zwei Werte N_Y und N_X habe ich fuer exakt diese Matrizen gesehen. Einmal N_Y=N_X=(1/4). Dies macht wenig Sinn da dadurch die Werte der Faltung zwischen -255 und +255 liegen und sich nicht als Graubild darstellen lassen. Mehr Sinn macht N_Y=N_X=(1/8). In diesem Fall wuerden die Werte der Faltung zwischen -128 und +128 liegen und durch ein positives Verschieben aller Werte um 128 liesse sich das Gradientenbild erstellen. Ob ein zusaetzlicher Threshold notwendig ist zur Darstellung der Gradientenplots konnte ich immer noch nicht rausfinden.

Wieso gibt es da nicht wenigstens irgendein vernuenftiges Tutorial fuer dieses Verfahren?

**Aphton**

Es ist klar, dass negative Werte rauskommen können.. Wenn man die Matrizen genauer ansieht, transformiert man von [0..255] auf [-1020..1020]
Dh du müsstest einen Normalisierungsschritt machen, indem du zuerst 1020 addierst, dann mit 255/2040 multiplizierst.

Bin mir momentan nicht ganz sicher.. Meine Überlegung war - wenn die "obere Pixellinie" die mit der ersten Zeile der G_Y Matrix multipliziert wird, aus 255'en bestehen, dann kommt dort als max. Wert 1*255 + 2*255 + 1*255 = 4*255 = 1020 raus.. Dasselbe gilt für die untere Pixellinie = -1020

Edit: Nen Sonderfall hat man bei Rändern. Ich hab ne Beispielsimplementierung, wo ich die Operatoren zähle, damit ich den neuen Intervall jeweils für X und Y kenne und somit dann normalisieren kann..

zusammenfalten · markieren

Delphi-Quellcode:

			
procedure gray(bmp: TBitmap);

var

  sl: PRGBTriple;

  y, x: Integer;

begin

  for y := 0 to bmp.Height - 1 do

  begin

    sl := bmp.ScanLine[y];

    for x := 0 to bmp.Width - 1 do

    begin

      sl.rgbtBlue   := (sl.rgbtBlue + sl.rgbtGreen + sl.rgbtRed) div 3;

      sl.rgbtGreen  := sl.rgbtBlue;

      sl.rgbtRed    := sl.rgbtBlue;

      Inc(sl);

    end;

  end;

end;

procedure sobel(bmp: TBitmap);

const

  SobelXOperator: Array[-1..1,-1..1] of ShortInt =

    ((-1,0,1),

     (-2,0,2),

     (-1,0,1));

  SobelYOperator: Array[-1..1,-1..1] of ShortInt =

    ((1,2,1),

     (0,0,0),

     (-1,-2,-1));

var

  Data: Array of Array of Byte;

  y, x: Integer;

  i, j: Integer;

  posXOp, negXOp: Integer;  // positive & negative Sobel X Operatoren

  posYOp, negYOp: Integer;  // -- || --                  Y Operatoren

  sumX, sumY: Integer;

  sl: PRGBTriple;

begin

  SetLength(Data, bmp.Height, bmp.Width);

  for y := 0 to bmp.Height - 1 do

  begin

    sl := bmp.ScanLine[y];

    for x := 0 to bmp.Width - 1 do

    begin

      Data[y,x] := sl.rgbtBlue;

      Inc(sl);

    end;

  end;

  for y := 0 to bmp.Height - 1 do

  begin

    sl := bmp.ScanLine[y];

    for x := 0 to bmp.Width - 1 do

    begin

      sumX    := 0;

      sumY    := 0;

      posXOp  := 0;

      negXOp  := 0;

      posYOp  := 0;

      negYOp  := 0;

      for i := -1 to 1 do

        if (x + i >= 0) and (x + i < bmp.Width) then

          for j := -1 to 1 do

            if (y + j >= 0) and (y + j < bmp.Height) then

            begin

              if SobelXOperator[j,i] < 0 then

                inc(negXOp, abs(SobelXOperator[j,i]))

              else

                inc(posXOp, abs(SobelXOperator[j,i]));

              if SobelYOperator[j,i] < 0 then

                inc(negYOp, abs(SobelYOperator[j,i]))

              else

                inc(posYOp, abs(SobelYOperator[j,i]));

              inc(sumX, Data[y+j,x+i] * SobelXOperator[j,i]);

              inc(sumY, Data[y+j,x+i] * SobelYOperator[j,i]);

            end;

      // Normalisierungsschritt

      inc(sumX, negXOp*255);

      sumX := sumX div (negXOp + posXOp);

      inc(sumY, negYOp*255);

      sumY := sumY div (negYOp + posYOp);

      sumX := (sumX + sumY) div 2;

      // .. done

      sl.rgbtBlue   := sumX;

      sl.rgbtGreen  := sumX;

      sl.rgbtRed    := sumX;

      inc(sl);

    end;

  end;

end;

**Medium**

Ich habe exakt genau diese Schritte als Basis meiner Bachelor Arbeit benutzt

(Canny-Edge-Detector lässt grüßen.)

Die beiden Richtungen des Sobel-Operators werden dabei als Magnitude gerechnet, also die Länge der Vektoren, die sich aus den Grauwerten der beiden Ergbnisbilder an einer Koordinate ergeben: Sqrt(Sobel_X(x, y)² + Sobel_Y(x, y)²). Damit ist das Problem der negativen Werte gleich mit erschlagen.

Um einen Skalierungsfaktor habe ich mich in meiner Arbeit nicht geschert, da dies eh nur ein Zwischenschritt ist, und man die Non-Maxima-Unterdrückung locker ohne Normierung machen kann (bzw. sollte, weil schneller).
Wenn es denn aber sein muss, schaut man sich einfach mal den extremen Fall an:

markieren

Code:

			 1  1 1|0             1 0 -1      1  2  1

 1  0  0  mit Kernlen 2 0 -2 und   0  0  0

1|0 0  0              1 0 -1     -1 -2 -1

Sobel_X und _Y sind hierbei = 3, deren Magnitude also rund 4,243. Das wäre der höchte Wert, auf den anzupassen wäre. Da dieser Fall aber ein starkes Extrem ist, zeigt ein so angepasstes als Graustufen angezeigtes Bild fast nur nahezu schwarze Stellen. Ich hatte daher um mir das Zwischenergebnis anzuzeigen eine nicht-lineare Skalierung genommen (Magnitude^K / 4,234 mit 0<K<1). Aber dies hat wie gesagt für die Non-Maxima-Unterdrückung keine Relevanz.

Wichtiger ist für diese, dass du neben der Magnitude der Sobel-Operatoren auch deren Richtungen beachtest, weil in diese Richtungen "gesucht" werden muss. Die Richtung ergibt sich aus Atan2(Sobel_Y(x, y), Sobel_X(x, y)), was einen Winkel ergibt. Den genauen Winkel braucht man allerdings nicht, es genügt in die bei Pixeln 8 möglichen Richtungen zu klassifizieren: 0, 45, 90, 135, 180, 225, 270 und 315 Grad.

Generell sind die Deutschen und Englischen Wikipedia-Artikel zum Canny-Edge-Detector sehr informativ, und diese sowie die darin angegeben Quellen (sowie eine Hand voll Google) haben nach etwas Arbeit ganz gut zum Ziel geführt: Listen von 4-Nachbarschafts-Koordinaten von zusammenhängenden Kanten, die ich darauf hin reduziert und zu Catmull-Rom-Splines verwertet habe. (Der Weg zu diesen war erheblich steiniger als der CED selbst, auwei das waren Zeiten

)

**Gutelo**

Hallo Medium,

danke fuer die Antwort. Dass man aus den x und y gradienten das endgueltige bild mittels G=sqrt(Gx*Gx + Gy*Gy) berechnet ist mir klar. Es geht mir um eine vernuenftige Darstellung der einzelnen Bilder Gx und Gy und da muessen alle Werte positiv sein.

Ich habe immer noch das Problem, dass sowohl die einzelnen Bilder als auch das endgueltige Sobel Bild keinerlei Kannten zeigen. Wahrscheinlich habe ich irgendwo einen Fehler in der Implementierung. Hier mein Code:

zusammenfalten · markieren

Delphi-Quellcode:

			
// ##############################################################

// Prozedur um Graubild zu erzeugen

// ##############################################################

Procedure ConvertToGrayScale(ImgIn : TBitmap; var ImgOut : TBitmap);

type TRGB = Array[1..3] of Byte;

     PixArray = Array[1..MaxInt div SizeOf(TRGB)-1] of TRGB;

     PPixArray = ^PixArray;

     PixArray2D = Array of PPixArray;

var ImgIn2D : PixArray2D;     // Access to ImgIn Pixels

    ImgOut2D : PixArray2D;    // Access to ImgOut Pixels

    rows,cols : Integer;

    GrayShade : Byte;

begin

   // Build 2D Arrays via 'scanline' to speed up pixel operations

   // access pixels: Img[a]^[b][c] , a=line, b=col, c: 3=R,2=G,or 1=B

   // Input Image:

   SetLength(ImgIn2D,ImgIn.Height);

   For rows := 0 to ImgIn.Height-1 do ImgIn2D[rows] := ImgIn.ScanLine[rows];

   // Output Image:

   SetLength(ImgOut2D,ImgOut.Height);

   For rows := 0 to ImgOut.Height-1 do ImgOut2D[rows] := ImgOut.ScanLine[rows];

   // Convert to grayscale

   for rows := 0 to ImgIn.Height-1 do

   for cols := 0 to ImgIn.Width-1 do

    begin

      GrayShade := Round(  0.3 * ImgIn2D[rows]^[cols][3]

                         + 0.6 * ImgIn2D[rows]^[cols][2]

                         + 0.1 * ImgIn2D[rows]^[cols][1]);

      ImgOut2D[rows]^[cols][1] := GrayShade; // B-value

      ImgOut2D[rows]^[cols][2] := GrayShade; // G-value

      ImgOut2D[rows]^[cols][3] := GrayShade; // R-value

    end;

end; 

// ##############################################################

// Prozeduren um Filter Matrizen zu erzeugen

// ##############################################################

Procedure MakeSmoothenFilter(var Filter : TFilter);

var i : Integer;

begin

   // Set Dimensions of Filter Array

   SetLength(Filter,5);

   for i := 0 to High(Filter) do SetLength(Filter[i],5);

   // Define Gauss Filter Matrix

   //   2  4  5  4 2

   //   4  9 12  9 4

   //   5 12 15 12 5

   //   4  9 12  9 4

   //   2  4  5  4 2

   // first Line

   Filter[0,0] := 2; Filter[0,1] := 4; Filter[0,2] := 5;

   Filter[0,3] := 4; Filter[0,4] := 2;

   // second Line

   Filter[1,0] := 4; Filter[1,1] := 9; Filter[1,2] := 12;

   Filter[1,3] := 9; Filter[1,4] := 4;

   // third Line

   Filter[2,0] := 5;  Filter[2,1] := 12; Filter[2,2] := 15;

   Filter[2,3] := 12; Filter[2,4] := 5;

   // fourth Line

   Filter[3,0] := 4; Filter[3,1] := 9; Filter[3,2] := 12;

   Filter[3,3] := 9; Filter[3,4] := 4;

   // fifth Line

   Filter[4,0] := 2; Filter[4,1] := 4; Filter[4,2] := 5;

   Filter[4,3] := 4; Filter[4,4] := 2;

end;

Procedure MakeSobelFilterX(var Filter : TFilter);

var i : integer;

begin

   // Set Dimensions of Filter Array

   SetLength(Filter,3);

   for i := 0 to High(Filter) do SetLength(Filter[i],3);

   // Define Sobel-X Filter Matrix

   //   -1  0  1

   //   -2  0  2

   //   -1  0  1

   // first Line

   Filter[0,0] := -1; Filter[0,1] := 0; Filter[0,2] := 1;

   // second Line

   Filter[1,0] := -2; Filter[1,1] := 0; Filter[1,2] := 2;

   // third Line

   Filter[2,0] := -1; Filter[2,1] := 0; Filter[2,2] := 1;

end;

Procedure MakeSobelFilterY(var Filter : TFilter);

var i : integer;

begin

   // Set Dimensions of Filter Array

   SetLength(Filter,3);

   for i := 0 to High(Filter) do SetLength(Filter[i],3);

   // Define Sobel-Y Filter Matrix

   //    1   2   1

   //    0   0   0

   //   -1  -2  -1

   // first Line

   Filter[0,0] :=  1; Filter[0,1] :=  2; Filter[0,2] :=  1;

   // second Line

   Filter[1,0] :=  0; Filter[1,1] :=  0; Filter[1,2] :=  0;

   // third Line

   Filter[2,0] := -1; Filter[2,1] := -2; Filter[2,2] := -1;

end;

// ##############################################################

// Prozedur um Filter auf ein Bild anzuwenden (Faltung)

// ##############################################################

Procedure ApplyFilterOnImage(var ImgIn, ImgOut : TBitmap; Filter : TFilter);

type TRGB = Array[1..3] of Byte;

     PixArray = Array[1..MaxInt div SizeOf(TRGB)-1] of TRGB;

     PPixArray = ^PixArray;

     PixArray2D = Array of PPixArray;

var rows,cols : Integer;      // rows and cols in the image

    FLowX, FHighX : Integer;

    FLowY, FHighY : Integer;

    weight : Integer;         // Weight for Filter Matrix

    ImgIn2D : PixArray2D;     // Access to ImgIn Pixels

    ImgOut2D : PixArray2D;    // Access to ImgOut Pixels

    SumMinus : Integer;

    ScaleShift : Integer;

    PixelSum, x, y : Integer;

    Pixel : Integer;

begin

   // Filter matrix, element -> pixel position with respect to center pixel

   // Calculate extremes in x and y direction

   FLowX  := -Round(0.5 * Length(Filter)-1);

   FHighX := +Round(0.5 * Length(Filter)-1);

   FLowY  := -Round(0.5 * Length(Filter[0])-1);

   FHighY := +Round(0.5 * Length(Filter[0])-1);

   // Determine matrix weight and scaleshift required after convolution:

   ScaleShift := 0;

   SumMinus := 0;

   weight := 0;

   For y := 0 to High(Filter[0]) do

   For x := 0 to High(Filter) do

   begin

      if Filter[x,y] < 0 then SumMinus := SumMinus + Filter[x,y];

      weight := weight + Abs(Filter[x,y]);

   end;

   ScaleShift := Abs(Round((SumMinus/weight)*255));

   // Build 2D Arrays via 'scanline' to speed up pixel operations

   // access pixels: Img[a]^[b][c] , a=line, b=col, c: 3=R,2=G,or 1=B

   // Input Image:

   SetLength(ImgIn2D,ImgIn.Height);

   For rows := 0 to ImgIn.Height-1 do ImgIn2D[rows] := ImgIn.ScanLine[rows];

   // Output Image:

   SetLength(ImgOut2D,ImgOut.Height);

   For rows := 0 to ImgOut.Height-1 do ImgOut2D[rows] := ImgOut.ScanLine[rows];

   // Calculate filtered Image, i.e. convolution of Filter and ImgIn -> ImgOut

   For rows := 0-FLowY to ImgIn.Height-1-FHighY do

   For cols := 0-FLowX to ImgIn.Width-1-FHighX do

   begin

      // Perform Convolution

      PixelSum := 0;

      For y := FLowY to FHighY do

      For x := FLowX to FHighX do

      begin

        PixelSum := PixelSum +

            Filter[x-FLowX,y-FLowY]* ImgIn2D[rows+y]^[cols+x][1];

      end;

      Pixel := Round(PixelSum/weight) + ScaleShift;

      ImgOut2D[rows]^[cols][1] := Pixel;

      ImgOut2D[rows]^[cols][2] := Pixel;

      ImgOut2D[rows]^[cols][3] := Pixel;

   end;

end; 

// ##############################################################

// Prozedur um finales Sobelbild aus Einzelbildern zu erzeugen

// ##############################################################

Procedure GenerateFinalSobel(ImgSx, ImgSy : TBitmap; var ImgOut : TBitmap);

type TRGB = Array[1..3] of Byte;

     PixArray = Array[1..MaxInt div SizeOf(TRGB)-1] of TRGB;

     PPixArray = ^PixArray;

     PixArray2D = Array of PPixArray;

var  rows,cols : Integer;      // rows and cols in the image

     ImgSx2D  : PixArray2D;    // Access to ImgSx Pixels

     ImgSy2D  : PixArray2D;    // Access to ImgSy Pixels

     ImgOut2D : PixArray2D;    // Access to ImgOut Pixels

     Gx,Gy,Gf : Byte;

begin

   // Build 2D Arrays via 'scanline' to speed up pixel operations

   // access pixels: Img[a]^[b][c] , a=line, b=col, c: 3=R,2=G,or 1=B

   // SobelX Image:

   SetLength(ImgSx2D,ImgSx.Height);

   For rows := 0 to ImgSx.Height-1 do ImgSx2D[rows] := ImgSx.ScanLine[rows];

   // SobelY Image:

   SetLength(ImgSy2D,ImgSy.Height);

   For rows := 0 to ImgSy.Height-1 do ImgSy2D[rows] := ImgSy.ScanLine[rows];

   // Output Image:

   SetLength(ImgOut2D,ImgOut.Height);

   For rows := 0 to ImgOut.Height-1 do ImgOut2D[rows] := ImgOut.ScanLine[rows];

   // Perform G = sqrt(Gx*Gx + Gy*Gy);

   for rows := 0 to ImgSx.Height-1 do

   for cols := 0 to ImgSx.Width-1 do

   begin

     Gx := ImgSx2D[rows]^[cols][1];

     Gy := ImgSy2D[rows]^[cols][1];

     Gf := Round(sqrt(Abs(Gx*Gx)+Abs(Gy*Gy)));

     ImgOut2D[rows]^[cols][1] := Gf;

     ImgOut2D[rows]^[cols][2] := Gf;

     ImgOut2D[rows]^[cols][3] := Gf;

   end;

end;  

// ##############################################################

// Prozedur um geglaettetes Graubild zu erzeugen

// ##############################################################

Procedure Smoothen(var ImgIn, ImgOut : TBitmap);

var GaussFilter : TFilter;

    SobelXFilter : TFilter;

    ImgGray : TBitmap;

begin

   //convert to Grayscale

   ImgGray := TBitmap.Create;

   ImgGray.Width := ImgIn.Width;

   ImgGray.Height := ImgIn.Height;

   ConvertToGrayScale(ImgIn, ImgGray);

   //smoothen grayscale image

   MakeSmoothenFilter(GaussFilter);

   ApplyFilterOnImage(ImgGray, ImgOut, GaussFilter);

end;

// ##############################################################

// Prozedur fuer kompletten Sobel

// ##############################################################

Procedure Sobel(var ImgIn, ImgOut : TBitmap);

var SobelX, SobelY : TFilter;

    ImgSmooth, ImgSx, ImgSy : TBitmap;

begin

    // create ImgSmooth

   ImgSmooth := TBitmap.create;

   ImgSmooth.width := ImgIn.width;

   ImgSmooth.height := ImgIn.height;

   // Smoothen Image

   Smoothen(ImgIn, ImgSmooth);

   // create ImgSx

   ImgSx := TBitmap.create;

   ImgSx.width := ImgIn.width;

   ImgSx.height := ImgIn.height;

   // create ImgSy

   ImgSy := TBitmap.create;

   ImgSy.width := ImgIn.width;

   ImgSy.height := ImgIn.height;

   // Make SobelX and SobelY Filter

   MakeSobelFilterX(SobelX);

   MakeSobelFilterY(SobelY);

   // Apply Sobel Filter on ImgIn -> ImgSx and ImgSy

   ApplyFilterOnImage(ImgSmooth, ImgSx, SobelX);

   ApplyFilterOnImage(ImgSmooth, ImgSy, SobelY);

   // ImgSx and ImgSy -> ImgOut

   GenerateFinalSobel(ImgSx, ImgSy, ImgOut);

end;

Hier eine Prozedur zum Aufruf des Ganzen:

zusammenfalten · markieren

Delphi-Quellcode:

			procedure TForm1.Button2Click(Sender: TObject);

var ImgIn, ImgOut : TBitmap;

begin

  ImgIn := TBitmap.Create;

  ImgOut := TBitmap.Create;

  ImgIn.LoadFromFile('Book.bmp');

  ImgOut.Width := ImgIn.Width;

  ImgOut.Height := ImgIn.Height;

  //Smoothen(ImgIn, ImgOut);

  Sobel(ImgIn, ImgOut);

  Image3.Picture.Bitmap := ImgOut;

end;

Die Umwandlung in ein Graubild und das Glaetten mittels Gaussfilter klappt wunderbar. Die einzelnen Sobelbilder sehen nicht aus wie Bilder in denen horizontale oder vertikale Kannten betont sind sondern eher wie helle oder dunkle Bilder mit stark veraendertem Gammawert. Im finalen Sobelbild ist quasi nichts zu sehen, d.h. mehr oder weniger einfarbige Flaeche.

Gutelo

Edit: Code ist mit Lazarus erstellt, sollte aber 1:1 auf Delphi laufen

**jfheins**

Hast du mal ein Eingabebild und die zwei Ausgaben, die dein Programm produziert?

**Gutelo**

Hallo,

Ich habe die Bilder an dieses Post gehaengt

Gutelo

**Medium**

Zwar sehen deine "gesobelten" Bilder in der Tat etwas komisch aus (eher wie kontrastverminderte und teilinvertierte Versionen des Originals), aber ich sehe ein großes Problem bei deiner Vorgehensweise: Du nutzt als Zwischenspeicher für deine Schritte immer ein TBitmap. Du brauchst aber auch die negativen Werte der Sobel-Komponenten um nachher die korrekten Magnituden und Richtungen zu berechnen, da kommst du nicht drum rum!

Ich hatte für mein Programm damals eine eigenen FloatBitmap Klasse gemacht, und habe diese für sämtliche Operationen genutzt - ausser Laden und Speichern, dafür konnte diese Klasse ein .CreateFromBitmap() und ein .ToBitmap() durchführen. Ich habe die Bilder darin, also zumindest die, die zur Darstellung genutzt wurden, auf die Range 0..1 skaliert, und alle Farbkomponenten als Single hinterlegt. (Hatte auch den Hintergrund, dass ich das nachher so umgebaut habe, dass Gauss und Sobel in einem Shader von der Graka gemacht wurden, wo man das eh so braucht.)
Für die Farben hatte ich eine eigene FloatColor Klasse, die Methoden wie .ToYCC() und .ToRGB() oder .ToColor() gleich mit gebracht hat. Das FloatBitmap hat davon einfach ein 2D Array verwaltet, und ein paar Methoden zum Umwandeln eben.

Nutzt man sowas als "Mittler" zwischen den Schritten, sind Negative Farben und denormalisierte "Bilder" kein Problem mehr (streng genommen sind es ja schon fast keine Bilder mehr dann). Das würde ich als aller erstes machen, und dann mal schauen wie es danach aussieht.

Sowohl die Normaierung auf 0..1, als auch die deutlich erhöhte Genauigkeit durch Floats sind gerade bei den Zwischenschritten zum einen eine Vereinfachung, und das Zweite je nach Anwendungsfall schon fast eine Notwendigkeit finde ich. Wenn die Geschwindigkeit nicht hin haut, könnte man auch noch mit auf Integer-Range skalierten Farben arbeiten, muss dann aber aufpassen mit Ausreissern in den Zwischenschritten die wie beim Sobel dann auch mal über "1" (bzw. MaxInt) liegen können. Und es ist eine ziemliche Rumrechnerei. Wenn wirklich sehr schnelle Verarbeitung sein soll, würde ich letztlich wieder zum Shader greifen. Da das aber eine ganze Ecke Infrastruktur und potenziell Anpassungen im gesamten Programm braucht wenn man es nicht von Anfang an darauf ausgelegt hat, will ich das nicht uneingeschränkt als Heiland preisen.

Aber deine negativen Werte brauchst du. Definitiv. Wenn du die Zwischenschritte anzeigen willst, würde ich dafür das FloatBitmap von (-1..1) auf (0..255) mappen, und Werte unter/über -1/1 clampen. Dann bleibt genügend "Kontrast" um vernünftig was sehen zu können. (Diese Bilder taugen dann aber nicht mehr wirklich zum weiter damit arbeiten, nur zur Kontrollanzeige.)

**Gutelo**

Hallo Medium

Stimmt, ich sollte erstmal die Minuswerte beibehalten.

Was meinst du mit "würde ich dafür das FloatBitmap von (-1..1) auf (0..255) mappen, und Werte unter/über -1/1 clampen". Wenn ich nicht normiere dann varrieren die Werte von minimal -4*256 bis maximal 4*256 in den beiden "Teilbildern". Im naechsten Schritt - sqrt(Gx*Gx + Gy*Gy) - sollten aehnliche Werte rauskommen. Am Ende muesste ich doch diese Bereiche auf (0..255) mappen oder nicht?

Also ich rechne jetzt mal ohne Normierungsfaktor fuer die Sobel Matrizen die Werte fuer beide Sobel operatoren aus und anschliessend das finale Sobel Ergebnis. Danach bestimme ich die maximalen negativen und positiven Werte. Dann skaliere ich, so dass alle Werte zwischen 0 und 255 liegen. Richtig?

Gutelo

**Medium**

Zitat von Gutelo:

Wenn ich nicht normiere dann varrieren die Werte von minimal -4*256 bis maximal 4*256 in den beiden "Teilbildern".

Ja, deswegen meinte ich ja, dass die so gemappten Bilder nur zum Angucken taugen. Werte jenseits von -1 und 1 sind recht seltene Extrema in Fotos, und wenn man etwa -4 bis 4 auf 0 bis 255 mapped wird das Bild überwiegend wie 50% Grau aussehen. Geht natürlich auch, fand ich zum zwischen drin mal beschauen aber nicht so prima.

Zitat:

Im naechsten Schritt - sqrt(Gx*Gx + Gy*Gy) - sollten aehnliche Werte rauskommen. Am Ende muesste ich doch diese Bereiche auf (0..255) mappen oder nicht?

Nur, wenn du das Gradienten-"Bild" anzeigen willst. Letztlich willst du doch eigentlich nur deine Kanten haben, oder? Der Sobel-Schritt wird also am Ende nie angezeigt. Warum sollte man ihn dann auf Bitmap-Werte umrechnen? Einfach so lassen wie es aus der Filterung kommt, und damit die Non-Maxima-Unterdrückung machen. Was davon übrig bleibt dann als S/W Bild nehmen (Kanten weiss, Rest schwarz) oder wie auch immer weiter damit arbeiten. Aber löse dich davon, dass die Zwischenschritte "Bilder" sind. Man kann sie zur Anzeige als solche interpretieren und daraufhin anpassen, aber an sich sind das nur noch große Matrizen mit "irgendwelchen" Werten. Deswegen plädiere ich auch dafür, dass man das TBitmap als Container für diese nicht nimmt.

Zitat:

Also ich rechne jetzt mal ohne Normierungsfaktor fuer die Sobel Matrizen die Werte fuer beide Sobel operatoren aus und anschliessend das finale Sobel Ergebnis. Danach bestimme ich die maximalen negativen und positiven Werte. Dann skaliere ich, so dass alle Werte zwischen 0 und 255 liegen. Richtig?

Jain, s.o.

Canny edge algorithmus und Sobel Matrix

Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

AW: Canny edge algorithmus und Sobel Matrix

Forumregeln

jfheins Registriert seit: 10. Jun 2004 Ort: Garching (TUM) 4.579 Beiträge	#6 AW: Canny edge algorithmus und Sobel Matrix 27. Jul 2014, 19:03 Hast du mal ein Eingabebild und die zwei Ausgaben, die dein Programm produziert?
	Zitat

Gutelo Registriert seit: 29. Sep 2013 152 Beiträge	#7 AW: Canny edge algorithmus und Sobel Matrix 27. Jul 2014, 22:39 Hallo, Ich habe die Bilder an dieses Post gehaengt Gutelo Miniaturansicht angehängter Grafiken
	Zitat