Einzelnen Beitrag anzeigen


n/a Beiträge

Re: Bitte Assembler-Routine verbessern

  Alt 24. Dez 2007, 11:31
@Profi: Du hast Recht! Ist mir gestern gar nicht aufgefallen, Danke

Wegen ESI: Ich hab den Code jetzt auf ESI-Erhalt erweitert, weiß auch nicht mehr, wo ich mir gemerkt hab, dass man ESI einfach ändern kann..

function CharPos_JOH_SSE2_1_b(Ch : Char; const Str : AnsiString; aStart : Integer = 1) : Integer;
  test edx, edx
  jz @@NullString
  push esi
  mov esi, ecx
  dec esi
  mov ecx, [edx-4]
  cmp esi, ecx
  jle @@Continue
  xor eax, eax
  pop esi
  sub ecx, esi
  add edx, esi
  push ebx
  mov ebx, eax
  cmp ecx, 16
  jl @@Small
  mov ah, al {Fill each Byte of XMM1 with AL}
  movd xmm1, eax
  pshuflw xmm1, xmm1, 0
  pshufd xmm1, xmm1, 0
  movups xmm0, [edx] {Unaligned}
  pcmpeqb xmm0, xmm1 {Compare First 16 Characters}
  pmovmskb eax, xmm0
  test eax, eax
  jnz @@FoundStart {Exit on any Match}
  cmp ecx, 32
  jl @@Medium {If Length(Str) < 32, Check Remainder}
  sub ecx, 16 {Align Block Reads}
  push ecx
  mov eax, edx
  neg eax
  and eax, 15
  add edx, ecx
  neg ecx
  add ecx, eax
  movaps xmm0, [edx+ecx] {Aligned}
  pcmpeqb xmm0, xmm1 {Compare Next 16 Characters}
  pmovmskb eax, xmm0
  test eax, eax
  jnz @@Found {Exit on any Match}
  add ecx, 16
  jle @@Loop
  pop eax {Check Remaining Characters}
  add edx, 16
  add eax, ecx {Count from Last Loop End Position}
  jmp dword ptr [@@JumpTable2-ecx*4]
  xor eax, eax {Result = 0}
  bsf eax, eax {Get Set Bit}
  pop ebx
  pop esi
  inc eax {Set Result}
  pop edx
  bsf eax, eax {Get Set Bit}
  add edx, ecx
  pop ebx
  pop esi
  lea eax, [eax+edx+1] {Set Result}
  add edx, ecx {End of String}
  mov eax, 16 {Count from 16}
  jmp dword ptr [@@JumpTable1-64-ecx*4]
  add edx, ecx {End of String}
  xor eax, eax {Count from 0}
  jmp dword ptr [@@JumpTable1-ecx*4]
  dd @@NotFound, @@01, @@02, @@03, @@04, @@05, @@06, @@07
  dd @@08, @@09, @@10, @@11, @@12, @@13, @@14, @@15, @@16
  dd @@16, @@15, @@14, @@13, @@12, @@11, @@10, @@09, @@08
  dd @@07, @@06, @@05, @@04, @@03, @@02, @@01, @@NotFound
  add eax, 1
  cmp bl, [edx-16]
  je @@Done
  add eax, 1
  cmp bl, [edx-15]
  je @@Done
  add eax, 1
  cmp bl, [edx-14]
  je @@Done
  add eax, 1
  cmp bl, [edx-13]
  je @@Done
  add eax, 1
  cmp bl, [edx-12]
  je @@Done
  add eax, 1
  cmp bl, [edx-11]
  je @@Done
  add eax, 1
  cmp bl, [edx-10]
  je @@Done
  add eax, 1
  cmp bl, [edx-9]
  je @@Done
  add eax, 1
  cmp bl, [edx-8]
  je @@Done
  add eax, 1
  cmp bl, [edx-7]
  je @@Done
  add eax, 1
  cmp bl, [edx-6]
  je @@Done
  add eax, 1
  cmp bl, [edx-5]
  je @@Done
  add eax, 1
  cmp bl, [edx-4]
  je @@Done
  add eax, 1
  cmp bl, [edx-3]
  je @@Done
  add eax, 1
  cmp bl, [edx-2]
  je @@Done
  add eax, 1
  cmp bl, [edx-1]
  je @@Done
  xor eax, eax
  pop ebx
  pop esi
  pop ebx
  pop esi
  Mit Zitat antworten Zitat