![]() |
Performance VS Codestruktur/Codevereinfachung
Hallo zusammen,
Ich wollte mal eine allgemeine Diskussionsrunde eröffnen, mit einem Thema das mich schon sehr lange in der Programmierung beschäftigt. Wie der Titel schon sagt geht es darum, in welchem Fall oder bzw. ist es heutzutage überhaupt manchmal noch sinnvoll einen Code zuschreiben, der etwas "komplizierter" im Aufbau ist, aber dadurch gute Performance gibt, oder eher einen Code, der eine leichte und verständliche Struktur hat. Es bezieht sich größten Teils um Schleifen, die durchgegangen werden müssen, die ziemlich lang sind. Bei kleinen Arrays, ist es mir klar, dass es bei den heutigen Rechner recht egal ist. Ich nenne mal ein kleines Beispiel: Ich habe einen Array mit folgenden Daten:
Delphi-Quellcode:
Nun will ich bestimmte Zahlen aus diesem Array nur haben. Nehmen wir mal an :
var TestArray : array of Integer = [5,7,8,1,4,9,2,80,50...]
Delphi-Quellcode:
Der Array kann aber halt unterschiedlich groß sein. (Und ich weiß, mann könnte ihn jetzt sortieren, darum geht es mir aber nicht. Sagen wir mal die "Daten", wofür das Beispiel steht, kann man nicht so leicht sortieren.)
5,50,9
Mir würden jetzt 2 Arten einfallen, dies in Code umzusetzen. Die eine wäre mit Sachen wie
Delphi-Quellcode:
,
Break;
Delphi-Quellcode:
. Die andere wäre mit einer Prozedur.
Continue;
Delphi-Quellcode:
Diese Variante würde jetzt sie Schleife durchgehen, bis die 3 Werte gefunden wurden. Es geht halt jetzt auch noch darum, dass die Anzahl von Werten, die gesucht werden sich ändern können.
//Die Variante mit Break und Continue
var I, Found1,Found2,Found3 : Integer; begin Found1 := -1; //Auf einen Wert setzen, der 100% nicht im Array ist. Found2 := -1; Found3 := -1; for I := Low(TestArray) to High(TestArray) do begin if (Found1<>-1) and (Found2<>-1) and (Found3<>-1) then Break; if TestArray[I] = 5 then begin Found1 := 5; Continue; end; if TestArray[I] = 50 then begin Found2 := 5; Continue; end; if TestArray[I] = 9 then begin Found3 := 5; Continue; end; end; end; Die Variante, kann man natürlich in ne "komplexere" Prozedur packen, um einen leichten Aufruf zumachen, aber das Grundprinzip wäre gleich. Eine recht einfache Code Variante wäre jetzt diese :
Delphi-Quellcode:
Mann sieht sofort das bei dieser Variante, der Array natürlich mehrmals durchgegangen wird, aber schon um einiges übersichtlicher ist. (Natürlich kann im Array auch nen Record liegen, wo ein Wert geprüft werden muss und ein andere Wert vom Record benötigt wird. Das Beispiel wollte ich jetzt recht einfach halten)
function FindValue(aArray : array of Integer; aNeedValue : Integer) : Integer;
var I : Integer; begin Result := -1; for I := Low(aArray) to High(aArray) do begin if aArray[I] = aNeedValue then begin Result := aNeedValue; Exit; end; end; end; var Found1,Found2,Found3 : Integer; begin Found1 := FindValue(TestArray,5); Found2 := FindValue(TestArray,50); Found3 := FindValue(TestArray,9); if (Found1<>-1) and (Found2<>-1) and (Found3<>-1) then begin //Weitere Ablauf danach end; end; Jetzt zu den Fragen : Macht es sinn einen Code in der 1. Variante eher zuschreiben als in der 2. ? Macht es eigentlich überhaupt heutzutage noch sinn oder solche Code-Strukturen nachzudenken, oder denke ich da nur zu Performance orientiert? :-D Würde euch noch eine Variante vielleicht einfallen, die ich jetzt nicht bedacht habe, die beides vereint? Was wäre euch als Programmierer, der an einem Projekt mitarbeitet, wichtiger? Gruß NickelM |
AW: Performance VS Codestruktur/Codevereinfachung
Ich will keine Spaßbremse sein, aber das Wichtigste wäre mir eine ordentliche Dokumentation, ganz egal wie die Implementation aussieht. Es muss klar ersichtlich sein dass ich nicht nach "-1" suchen kann da du das als Ersatz für "Nicht gefunden" nimmst. Auch verstehe ich nicht ganz warum du den Wert noch einmal zurückgibst wenn man doch nur den will. Dich interessiert doch nur ob alle drei gefunden wurden. Oder?
Dass der Code leserlich und verständlich ist doch generell wichtiger als vielleicht ein paar Takte zu sparen. Ist es wirklich ein Flaschenhals, erst dann lohnt es sich, auf Geschwindigkeits-Optimierungen zu stürzen. Dann musst du schauen, wiederverwendbaren Code zu produzieren. Sind es immer fix drei Werte bei denen du wissen willst "Kommt vor? J/N". Warum nicht gleich ein Array machen wo du so viele Werte reinstecken kannst wie du willst? Ich persönlich würde es so machen:
Delphi-Quellcode:
/// <returns>
/// Gibt an ob alle Elemente in <paramref name="checkFor" /> /// in <paramref name="checkedArray" /> enthalten sind /// </returns> /// <param name="checkFor"> /// Elemente können mehrfach vorliegen. Ist zwei mal das Element <c>0</c> /// enthalten <b>muss</b> <paramref name="checkedArray" /> das Element /// <c>0</c> zwei mal enthalten, sonst wird <c>False</c> zurückgegeben /// </param> function arrayContains( const checkedArray: TArray<Integer>; const checkFor: TArray<Integer> ): Boolean; var arrayIterator: Integer; checkForRemaining: TList<Integer>; checkedInteger: Integer; begin checkForRemaining := TList<Integer>.Create(); try checkForRemaining.AddRange(checkFor); for arrayIterator in checkedArray do begin for checkedInteger in checkForRemaining do if (arrayIterator = checkedInteger) then begin checkForRemaining.Remove(checkedInteger); Break; end; end; Result := (checkForRemaining.Count = 0); finally checkForRemaining.Destroy(); end; end; Das ist flexibel (wenn auch auf grade Integer zugeschnitten) und erlaubt auch das Prüfen auf mehrfaches Vorkommen eines Elements.
Delphi-Quellcode:
const
testArray: TArray<Integer> = [4, -12, 0, -1, 99, 0]; checkFor1: TArray<Integer> = [99, 4, 0]; checkFor2: TArray<Integer> = [6, 66, 666]; checkFor3: TArray<Integer> = [0, 0]; checkFor4: TArray<Integer> = [0, 0, 0]; begin WriteLn( arrayContains(testArray, checkFor1) ); // True WriteLn( arrayContains(testArray, checkFor2) ); // False WriteLn( arrayContains(testArray, checkFor3) ); // True WriteLn( arrayContains(testArray, checkFor4) ); // False readln; end. Ich persönlich wäre damit zufrieden. Ist das performant? Nein, wahrscheinlich geht da mehr. Insbesondere wenn es keine Integer sondern Records wären. |
AW: Performance VS Codestruktur/Codevereinfachung
Die Breaks und Continues sind meiner Menung nach gar nicht nötig, da Du ja abhängig von Found1-3 die Bearbeitung der Schleife beenden könntest, wenn du nicht ein for sondern ein while oder repeat...until verwenden würdest. Dann ist die Schleife genauso performant, und trotzdem besser verständlich.
Oder ist for so viel besser als while? Sherlock |
AW: Performance VS Codestruktur/Codevereinfachung
Es kommt halt immer darauf an.
Hier sehe ich aber auch einen Standard-Fall (sind die Elemente in Menge A in der Menge B enthalten), wo es sich lohnt die eigene Bibliothek um diesen Fall zu erweitern. Wichtig im Hinblick auf die Performance ist die richtige Art durch die Arrays zu iterieren: langsam
Delphi-Quellcode:
vs. schnell
for a in ValuesA do
for b in ValuesB do if Comparer.Equals( a, b ) then
Delphi-Quellcode:
denn im letzteren müssen keine Werte kopiert werden.
for idxA := Low( ValuesA ) to High( ValuesA ) do
for idxB := Low( ValuesB ) to High( ValuesB ) do if Comparer.Equals( ValuesA[idxA], ValuesB[idxB] ); |
AW: Performance VS Codestruktur/Codevereinfachung
Zitat:
* im Normalfall "einfach" * wenn zeitkritischer oder viel zu langsam, dann "schnell", aber möglichst "einfach" (also Beides kombiniert) * wenn extrem zeitkritisch .... nja, kommt selten vor Zitat:
Zitat:
Delphi-Quellcode:
danach, denn davor kann es nicht zutreffen,
if (Found1<>-1) and (Found2<>-1) and (Found3<>-1) then ...
bzw. da prüfen, wo die Continue stehen, denn nur da hat sich gerade was geändert z.B.
Delphi-Quellcode:
Found* sind doch eher Boolean (Wert gesetzt oder nicht). :stupid:
for I := Low(TestArray) to High(TestArray) do
begin case TestArray[I] of 5: Found1 := 5; 50: Found2 := 50; //5; 9: Found3 := 9; //5; else Continue; end; if (Found1<>-1) and (Found2<>-1) and (Found3<>-1) then Break; end; |
AW: Performance VS Codestruktur/Codevereinfachung
Eigentlich bringst du wohl eher unfreiwillig in deinem Eingangspost schon ein gutes Argument gegen die optimierte Variante: Dein Beispielcode mit Break - Continue liefert nämlich in den Variablen Found1..3 andere Werte als die übersichtlichere Routine mit FindValue. Typischer Copy-Paste-Error halt.
|
AW: Performance VS Codestruktur/Codevereinfachung
Ich sag dazu nur:
![]() Kurzum: Schon vor 30 Jahren war das Problem da, und damals sagte man: Mach das es tut, dann mach es richtig, dann mach es schnell. Und ja, natürlich ist es legitim sich heutzutage Gedanken über performance und optimierte Verarbeitung zu machen. Die Frage ist allerdings, ob es wirklich nötig ist. Beispiel: Du lädst diese Daten von einer DB, um sie dann in Deiner Anwendung zu sortieren und zu bearbeiten. Ist es nicht vielleicht sinnvoller, das filtern und sortieren ggf. auf der DB zu machen? Vermutlich. Kann die DB das gut? Nein? -> Vielleicht nutzt Du nicht die richtige Art von Datenbank. Kann eine anderen Datenbank das besser? Ja? -> Problem gelöst. Wenn Du eine spezielle Aufgabe hast ist es es vielleicht die beste Option, diese Aufgabe an Tools zu delegieren, die es a) inzwischen meist für umme gibt und b) für diesen Fall hochspezialisiert sind. Beispiel Suche: Wer implementiert denn heute noch eine schnelle Suche selber? Hochkomplexe binäre baumstrukturen für Indices, die richtig zu verwalten etc... Heute nimmt man da SolR oder Elasticsearch, pumpt die zu durchsuchenden Daten da rein, ein REST-Call und *wuppdi* sind die Ergebnisse da. Und ja: Man muss ein zusätzliches Softwaresystem installieren und am laufen halten. Und ja: Das kostet im Zweifel auch Hardware. Aber das Ergebnis ist deutlich besser als das, was man selber erreichen könnte (da arbeiten im Zweifel hunderte Spezialisten an komplexester Optimierung), und man bekommt das vor allem inkl. Doku und einer Community die man um Hilfe bitten kann sozusagen frei Haus geliefert. Stream Processing? Apache Kafka und Konsorten. Logaggregation und Analyse? FluentD, ElasticSearch, Kibana. Verteiltes Caching? Redis. Es gibt kaum noch Bereiche, die nicht schon durch existierende Lösungen sehr gut abgedeckt sind und sich meist mit wenig Aufwand integrieren lassen. |
AW: Performance VS Codestruktur/Codevereinfachung
Zitat:
Zitat:
Delphi-Quellcode:
verwenden, was aber klar ist. Werde ich mir mal merken. :-D
If...then...else..if...then...else continue;
Zitat:
Wenn ich nen Array von Record durchgehen muss, was wäre dann schneller? Einen Pointer auf den Record vom Array speichern und den Pointer zum lesen benutzen oder eher direkt immer über den Array abfragen?
Delphi-Quellcode:
VS.
TestP := @TestArray[I];
if TestP^.I = 5 then Result := TestP^.S;
Delphi-Quellcode:
if TestArray[I].I = 5 then
Result := TestArray[I].S; Zitat:
Ich gehöre zu der Art von Programmierer, die sich halt genau selber über solche Sachen gedanken macht und verstehen will zumindest um groben was besser wäre. Manche Dinge verlangen wiederrum speziales Fachwissen in dem jeweiligen Bereich, womit man besser bedient ist, sich auf Komponenten zuverlassen als selber Hand anzulegen. Es geht mir auch um Fälle, wo es speziel auf die jeweilige Daten vielleicht abgestimmt werden muss. Also ich hab schon öfters nen kleinen Algo geschrieben, auch wenn der recht bescheiden war, der meine Zwecke erfüllt. Wegen irgendwelche Kleinigkeiten finde ich, muss man keine große Lib verwenden. Und in diesem Fall möchte ich schon wisssen, wie es funktioniert. (Dies trifft halt aber nur kleinen Mengen zu, worum es ja in dieser Diskussion mir ja nicht geht :-D) Aber wenn ich eine Lib benutze, weil es ein bekanntes Problem ist und es nicht mit der funktioniert, was dann? (Gehen wir auch mal davon aus, dass dies die einzige ist, die nah dran kommt und überhaupt das man in etwa macht, was man will :-D) Ich kann mir nicht vorstellen, das ein Kunde dann sagt : "Ist egal, dass es lange Dauert, hauptsache funkt." Dann wäre es sinnvoll, wenn man sich als Programmierer mit anderen zusammen setzt und schaut wo das Problem an der Lib liegt und wie man es lösen kann. Selber schreiben oder Lib selber erweitern, für diesen Zweck. Wäre es dann nicht auch sinnvoll, zuwissen wie diese funktioniert und warum die Leute der Lib das so gemacht haben? Oder denke ich da wieder viel zu weit? :gruebel: Naja okay, eigentlich kann ich mir die Frage fast selber beantworten...Zu den Leuten von der Lib gehen und sagen "Hi, ehm ja eure Lib macht nicht das was wir wollen. Macht mal." Hab ich recht? :-D |
AW: Performance VS Codestruktur/Codevereinfachung
Ob Pointer oder Array-Zugriff ist eins -> es macht keinen Unterschied.
Ich habe so ein paar
Delphi-Quellcode:
Methoden geschrieben und bei 1.000.000 extrem fetten Records im Array dauerte das Durcharbeiten 8ms. Mit
TArray
Delphi-Quellcode:
lag ich bei 20 Sekunden.
for in
Mehr Records konnte ich nicht testen, da der Speicher am Anschlag war :stupid: |
AW: Performance VS Codestruktur/Codevereinfachung
Zitat:
Beispiel: Wir wollen Daten über einen Service an einen externen Provider verschicken. Der Service muss sich zu jedem Datenpaket noch zusätzliche Daten aus der DB holen. Wenn ich das jetzt naiv löse (am besten noch mit tollen Businessobjekten per lazy load), kann ich mir hinterher etwaige Performanceoptimierungen abschminken. Auch ein Cache bringt nicht viel. Allerdings würde ich innerhalb der Requirements dein Tantra berücksichtigen. Vermutlich ist das auch so gemeint. Was die Eingangsfrage anbelangt: In seltenen Ausnahmefällen wird man schmutzigen Code schreiben müssen, der einfach nur auf Performance ausgelegt ist. Dieser Code sollte imho dann ausgelagert und explizit als "Mittel zum Zweck" kommentiert werden. Das wird aber nur sehr selten nötig sein. Tolle Standardlösungen wird man aber auch nicht ständig verwenden können, zumal wir hier nicht direkt von Enterpriselösungen reden, sondern eher von bisserl Code. Allerdings: Einen optimalen Algorithmus wird es allemal geben. |
Alle Zeitangaben in WEZ +1. Es ist jetzt 22:06 Uhr. |
Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz