Forum: Programmieren allgemein
by Medium,
7. Dez 2009
Da hättest du das gleiche Problem, dass ich auch gedanklich hatte, als ich den Algo als nicht parallelisierbar bezeichnet hab: Abbruchbedingung ist die Summe aller Thread-Teilergebnisse, d.h. sie müssten nach jeden Schritt synchronisiert, die Summe gebildet und dann ggf. fortgeführt werden. Zwar "erschlägt" man so viele Divisionen wie man CPUs hat auf ein Mal, jedoch ist der organisatorische...
Forum: Programmieren allgemein
by Medium,
7. Dez 2009
Ah, n ist vorab bestimmbar, alles klar :) Danke!
Forum: Programmieren allgemein
by Medium,
6. Dez 2009
Wie parallelisierst du den Algorithmus? (Hab grad kein Delphi-Parser zur Hand, und das Riesenprogramm war ohne Highlighting bei der Formatierung praktisch undurchschaubar :snowball:)
Forum: Programmieren allgemein
by Medium,
18. Nov 2009
Bei den 50% liegst du richtig. Weitere Kerne zu nutzen ist aber, wieder ein mal, nur möglich wenn du parallelisieren kannst, wie auch bei der Grafikkarte oder den SIMD Befehlssätzen. Ein einzelner Thread (den dein Programm derzeit wohl nur hat) kann nicht verteilt werden, und eine Aufgabe müsste in Teile zerlegt werden die gleichzeitig verarbeitet werden können. Im Idealfall in so viele Teile wie...
Forum: Programmieren allgemein
by Medium,
17. Nov 2009
Ungetestet, und keine Ahnung ob das wirklich schneller ist. Spart ein paar OPs, ob es damit auch cycles spart ist nie so sicher :) Zumindest spart es eine Menge pushes auf den FPU Stack! Auch möglich, dass man den Vergleich mit i noch etwas optimieren kann, ohne die Statusbits erst noch nach AX zu schaufeln. Das wait kann man sich erfahrungsgemäß so gut wie immer sparen. In meinen...
Forum: Programmieren allgemein
by Medium,
17. Nov 2009
Auch SSE ist nur bei Parallelisierung brauchbar (SIMD). Was soll der Code eigentlich bringen? Warum will man eine bereits bekannte Zahl so annähern? (Kettenbruchdarstellung wäre jetzt das einzige was mir so einfiele, die wird mit Floats bei sehr langen Ketten dann aber halt auch eher schwammig.)
Forum: Programmieren allgemein
by Medium,
17. Nov 2009
Hmm, du weisst schon, dass du ab irgendwann da präzisionsbedingt nur noch Nullen addierst, oder?
Und auf der GraKa würde DAS hier nix bringen. Zum einen können erst eine Hand voll der neusten überhaupt mit Double-Precision arbeiten, zum anderen sind die nur fix wenn man einProblem sehr gut parallelisieren kann. Das da oben ist mal sowas von sequenziell, da müsste man wenn schon einen...