AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren

Geht das noch schneller? - Bitmap-Verrechnung

Ein Thema von Harry Stahl · begonnen am 22. Nov 2014 · letzter Beitrag vom 5. Jan 2015
Antwort Antwort
Seite 8 von 8   « Erste     678
manfred42

Registriert seit: 23. Nov 2014
Ort: Leipzig
6 Beiträge
 
Delphi 7 Professional
 
#71

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 30. Nov 2014, 17:47
Nach flüchtigem Verfolgen der Diskussion meine ich:
Es geht hier, wie schon anklang, um Alphablending.
Da gab es doch 2005 das Thema
Alphablending mit MMX / SSE Befehle

Aber zur jetzigen Diskussion
Wenn man anstatt 255 durch 256 per Shift dividiert,
dann geht das nur bei nichnegativem Nenner.

Für den Datentyp Int32 kann man den Trick mit der
magischen Zahl $8081 zur Division durch 255 verwenden.

const
Magic: UInt16 = $8081;
var
n: Integer;

Dann ist für -Sqr(255) <= n<=Sqr(255)
( n * Magic) div (1 shl 23) = n div 255
Der Compiler erzeugt für den ersten Ausdruck
einen arithmetische Rechtsshift um 23.
Müsste mal mit RDTSC timen.

Manfred
Manfred Zimmer
  Mit Zitat antworten Zitat
arnof

Registriert seit: 25. Apr 2013
1.250 Beiträge
 
Delphi 10.1 Berlin Enterprise
 
#72

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 30. Nov 2014, 19:34
nur mit einem Auge das hier verfolgt, aber ist folgender Blog nicht genau das Thema:

http://www.delphifeeds.com/go/f/1217...hiFeeds.com%29


Die haben hier ein VCL Beispiel und hinweise für die Firemonkey Umsetzung
  Mit Zitat antworten Zitat
Benutzerbild von Harry Stahl
Harry Stahl

Registriert seit: 2. Apr 2004
Ort: Bonn
2.477 Beiträge
 
Delphi 11 Alexandria
 
#73

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 30. Nov 2014, 22:05
nur mit einem Auge das hier verfolgt, aber ist folgender Blog nicht genau das Thema:

http://www.delphifeeds.com/go/f/1217...hiFeeds.com%29


Die haben hier ein VCL Beispiel und hinweise für die Firemonkey Umsetzung
Nun ja, TParallel hatten wir hier ja auch schon. Der Link zeigt zwar die Parallel-For-Verwendung aber mit canvas.pixel, das ist ja so ziemlich das Langsamste, was man machen kann.
  Mit Zitat antworten Zitat
Dejan Vu
(Gast)

n/a Beiträge
 
#74

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 1. Dez 2014, 07:00
Man muss ja nicht gleich TParallel mit Canvas.Pixel verbinden. Vielleicht muss man auch manuell skalieren, d.h. durch Ausprobieren herausfinden, wo der break even zwischen Bildgröße und Anzahl der Threads ist.
  Mit Zitat antworten Zitat
manfred42

Registriert seit: 23. Nov 2014
Ort: Leipzig
6 Beiträge
 
Delphi 7 Professional
 
#75

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 1. Dez 2014, 20:45
Ein Versuch in Vorbereitung einer MMX-Version
Delphi-Quellcode:
procedure Draw32BitToBitmapPreMMX(const BitOben: TBitmap; BitUnten: TBitmap);
const
  Magic: UInt16 = $8081;
var
  W, x, y: Integer;
  Stride, ORes: Integer;
  RowO, RowU,
  RGBA_Oben, RGBA_Unten: ^TRGBQuad;
begin
  RowU := BitUnten.ScanLine[0];
  RowO := BitOben.ScanLine[0];

  W := BitUnten.Width;
  Stride := 4 * W;

  for y := 0 to BitUnten.Height - 1 do
  begin
    RGBA_Unten := RowU;
    RGBA_Oben := RowO;
    for x := 0 to W - 1 do
    begin
      ORes := RGBA_Oben^.rgbReserved;
      with RGBA_Unten^ do
      begin
        rgbBlue := (ORes * (RGBA_Oben^.rgbBlue - rgbBlue)) *
          Magic div (1 shl 23) + rgbBlue;
        rgbGreen := (ORes * (RGBA_Oben^.rgbGreen - rgbGreen)) *
          Magic div (1 shl 23) + rgbGreen;
        rgbRed := (ORes * (RGBA_Oben^.rgbRed - rgbRed)) *
          Magic div (1 shl 23) + rgbRed;
        rgbReserved := 255;
      end;
      Inc(RGBA_Unten); Inc(RGBA_Oben);
    end;
    Dec(Cardinal(RowU), Stride);
    Dec(Cardinal(RowO), Stride);
  end;
end;
Manfred Zimmer
  Mit Zitat antworten Zitat
manfred42

Registriert seit: 23. Nov 2014
Ort: Leipzig
6 Beiträge
 
Delphi 7 Professional
 
#76

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 1. Jan 2015, 21:22
Hier mein letztes Angebot
Delphi-Quellcode:
unit UAlphaSSE;
{
  SSE-Version von Harry Stahls

      procedure Draw32BitToBitmap(const BitOben: TBitmap; BitUnten: TBitmap);
}

interface

uses
  Winapi.Windows, Vcl.Graphics;

procedure Draw32BitToBitmapSSE(const BitOben: TBitmap; BitUnten: TBitmap);

implementation

procedure Draw32BitToBitmapSSE(const BitOben: TBitmap; BitUnten: TBitmap);
const
  // bbggrr
  RGBFF: array[0..1] of UInt64 = ($FF000000, 0);
  // src bytes ......01......00 ......03......02
  UMsk: array[0..1] of UInt64 = ($8080800180808000, $8080800380808002);
  // res bytes .......... 8 4 0 ................
  PMsk: array[0..1] of UInt64 = ($8080808080080400, $8080808080808080);
  C255: array[0..3] of Single = (1/255, 1/255, 1/255, 0);
var
  BmpO, BmpU: PRGBQuad;
  N: Integer;
begin
  N := BitOben.Height;
  BmpO := BitOben.ScanLine[N - 1];
  BmpU := BitUnten.ScanLine[N - 1];
  N := N * BitOben.Width - 1; // size of bitmap - 1
  asm
    PUSH EBX
    MOV EAX, BmpO
    MOV EDX, BmpU
    MOV ECX, N
// XMM7 free
    LDDQU XMM6, UMsk
    LDDQU XMM5, PMsk
    LDDQU XMM4, C255
    LDDQU XMM3, RGBFF
{$IFOPT O+}
    DB $66,$90 // 2-Byte-NOP
{$ELSE}
    DB $66,$0F,$1F,$44,0,0 // 6-Byte-NOP
{$ENDIF}
@Loop:
    MOVD XMM0, [EAX+4*ECX]// XMM0 = | 0 |α|B|G|R
    PEXTRW EBX, XMM0, 1 // EBX = α | B
    SHR EBX, 8 // EBX = 0 | α
    JZ @LoopEnd // test α ≡ RGBA_O.rgbReserved = 0 ?

    PSHUFB XMM0, XMM6 // unpack to Int32
    CVTDQ2PS XMM0, XMM0 // convert RGB_O to single FP

// SHUFPS XMM1, XMM0, $FF // !!! useless result
    MOVAPD XMM1, XMM0 // copy RGB_O (necessary !)
    SHUFPS XMM1, XMM1, $FF // XMM1 = α | α | α | α
    MULPS XMM1, XMM4 // XMM1 = 0 | α/255 | α/255 | α/255

    MOVD XMM2,[EDX+4*ECX] // XMM2 = | 0 |α|B|G|R
    PSHUFB XMM2, XMM6 // unpack to Int32
    CVTDQ2PS XMM2, XMM2 // convert RGB_U to single FP

    SUBPS XMM0, XMM2 // RGB_O - RGB_U
    MULPS XMM0, XMM1 // α * (RGB_O - RGB_U) / 255
    ADDPS XMM0, XMM2 // α * (RGB_O - RGB_U) / 255 + RGB_U

    CVTPS2DQ XMM0, XMM0 // convert FP to Int32 with rounding
    PSHUFB XMM0, XMM5 // pack into TRGBQuad
    POR XMM0, XMM3 // RGB_U.rgbReserved = $FF
    MOVD [EDX+4*ECX],XMM0 // restore RGB_U
@LoopEnd:
    SUB ECX, 1
    JNS @Loop
    POP EBX
  end;
end;
end.
QUOTE=Harry Stahl;1281742]
nur mit einem Auge das hier verfolgt, aber ist folgender Blog nicht genau das Thema:

http://www.delphifeeds.com/go/f/1217...hiFeeds.com%29
Die haben hier ein VCL Beispiel und hinweise für die Firemonkey Umsetzung
Nun ja, TParallel hatten wir hier ja auch schon. Der Link zeigt zwar die Parallel-For-Verwendung aber mit canvas.pixel, das ist ja so ziemlich das Langsamste, was man machen kann.[/QUOTE]

Mit anonymen Threads habe ich hier nichts machen können. Sie laufen schön langsam
nacheinander auf dem selben Prozessorkern. Könnte vor Wut das CPU-Gatget pulversisieren

Manfred
Manfred Zimmer

Geändert von mkinzler ( 1. Jan 2015 um 21:34 Uhr) Grund: Delphi-Tag gefixt
  Mit Zitat antworten Zitat
Alt 5. Jan 2015, 03:53     Erstellt von Motives
Dieser Beitrag wurde von Daniel gelöscht. - Grund: Verdacht auf SPAM und den damit verbundenen verschwenderischen Umgang von wertvollen Bits und Bytes
Ursa

Registriert seit: 5. Jan 2015
5 Beiträge
 
#77

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 5. Jan 2015, 06:46
Da kann man "gleichzeitig", in einem Thread.




samsung galaxy A3 schutzhülle

Geändert von Ursa ( 6. Jan 2015 um 02:27 Uhr)
  Mit Zitat antworten Zitat
Dejan Vu
(Gast)

n/a Beiträge
 
#78

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 5. Jan 2015, 06:56
Bitte antworte in vollständigen Sätzen, also: Subjekt, Prädikat, Objekt. Es ist ein wenig dadaistisch, was Du da von Dir gibst und von einfachen Menschen wie mir so nicht zu verstehen.
  Mit Zitat antworten Zitat
Thomasl

Registriert seit: 19. Jun 2006
Ort: Vreden
66 Beiträge
 
Delphi 11 Alexandria
 
#79

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 5. Jan 2015, 21:30
Soll das nur übereinander Angezeigt werden?
Da hätte ich auch ein Beispiel mit GDI+
da rechnet das ja die GPU zusammen?
Thomas Levering
  Mit Zitat antworten Zitat
Thomasl

Registriert seit: 19. Jun 2006
Ort: Vreden
66 Beiträge
 
Delphi 11 Alexandria
 
#80

AW: Geht das noch schneller? - Bitmap-Verrechnung

  Alt 5. Jan 2015, 23:26
Hier ein Beispiel mit GDI+
Die ganze Unit ist im Anhang incl. drehen und interpolation
einfach in ein Package einbinden und ausprobieren
Die GDI+ Units sind im XE4 bei mir schon enthalten

Einen Geschwindigkeitsvergleich habe ich noch nicht gemacht

Mit Transparenten PNG´s klappt das wohl, aber 32Bit BMP´s nicht

Kann ich noch Optimieren zb. Ram sparen, wenn ich den Stream Plattmache funktionieren JPG´s nicht mehr

Delphi-Quellcode:
uses GDIPOBJ, GDIPAPI;
...
  TTestImage = class(TGraphicControl)
  private
    { Private declarations }
    fImageA1: TGPImage;
    fImageB1: TPicture;
    fStream1: TMemoryStream;
    fImageA2: TGPImage;
    fImageB2: TPicture;
    fStream2: TMemoryStream;
...

procedure TTestImage.Paint;
var
  Graphics: TGPGraphics;
begin
  Graphics := TGPGraphics.Create(Canvas.Handle);
  try
    Graphics.DrawImage(fImageA1, 0, 0, Width, Height);
    Graphics.DrawImage(fImageA2, 0, 0, Width, Height);
  finally
    Graphics.Free;
  end;
end;
Angehängte Dateien
Dateityp: pas TestImage.pas (10,1 KB, 7x aufgerufen)
Thomas Levering
  Mit Zitat antworten Zitat
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 17:49 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz