Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Algorithmen, Datenstrukturen und Klassendesign (https://www.delphipraxis.net/78-algorithmen-datenstrukturen-und-klassendesign/)
-   -   Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory) (https://www.delphipraxis.net/199692-enthaelt-bin_data-genauer-benutzt-von-internalgetunicodecategory.html)

mael 12. Feb 2019 16:29

Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory)
 
Hallo,

In der Unit System.Character gibt es eine Funktion InternalGetUnicodeCategory(). Diese verwendet eine komplexe Indizierung und die Kategorie eines Codepoints zu bestimmen (ob es Control character ist, Letter, usw.).

Code:
Result := CategoryTable[CatIndexSecondary[CatIndexPrimary[C shr 8] + ((C shr 4) and $F)] + C and $F];
Die Indizierung ist wohl so aufgebaut um Speicher zu sparen, wahrscheinlich eine Art Trie. Allerdings bleibt es etwas nebulös wie das genau umgesetzt wurde. Sprich: Wie genau wurde die Liste der Codepoints, die ein array von 0..$10FFFF darstellt, auf diese Mehrfachindizierung reduziert? Kennt jemand die Hintergründe?

Die Array-Definitionen in System.Character_const.5.2.0.inc sind wohl etwas verständlicher. Sieht eher nach einer Art Bitcompression aus. Bin immernoch an Ratschlägen interessiert.

mael 13. Feb 2019 16:06

AW: Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory)
 
Keiner eine Idee?

freimatz 14. Feb 2019 11:25

AW: Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory)
 
Wo ist das Problem?

Uwe Raabe 14. Feb 2019 11:58

AW: Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory)
 
Zitat:

Zitat von mael (Beitrag 1425458)
Keiner eine Idee?

Wohl eher kein Interesse.

mael 14. Feb 2019 12:51

AW: Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory)
 
Zitat:

Zitat von Uwe Raabe (Beitrag 1425527)
Zitat:

Zitat von mael (Beitrag 1425458)
Keiner eine Idee?

Wohl eher kein Interesse.

Ok? Wie ist denn das zu verstehen...

Delphi fehlt die Unterstützung für viele Unicodeeigenschaften die im Standard beschrieben werden, und ich möchte sie analog implementieren.

Ich bin jedenfalls weitergekommen was die (Re-)Generierung der Tabellen angeht.

Uwe Raabe 14. Feb 2019 13:33

AW: Was enthält bin_data genauer? (Benutzt von InternalGetUnicodeCategory)
 
Zitat:

Zitat von mael (Beitrag 1425533)
Ok? Wie ist denn das zu verstehen...

Na ja, es scheint nicht viele zu interessieren, wie das im Detail zusammenhängt. Sonst hättest du vielleicht hier ein paar Antworten bekommen. Meine persönliche Reaktion auf die Frage war so in der Art: "Hmmmh, kenn ich mich nicht mit aus, kann ich nichts zu sagen, habe aber auch keine Zeit und Lust mich da reinzuarbeiten." Ich vermute, einigen anderen hier geht das genauso. Insofern trifft es "Keiner eine Idee?" zwar sachlich, aber nicht ursächlich.

Zitat:

Zitat von mael (Beitrag 1425533)
Delphi fehlt die Unterstützung für viele Unicodeeigenschaften die im Standard beschrieben werden, und ich möchte sie analog implementieren.

Wenn ausreichend Leute Probleme damit haben würden, gäbe es vermutlich auch eine größere Resonanz.

Zitat:

Zitat von mael (Beitrag 1425533)
Ich bin jedenfalls weitergekommen was die (Re-)Generierung der Tabellen angeht.

:thumb:


Alle Zeitangaben in WEZ +1. Es ist jetzt 02:35 Uhr.

Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz