Delphi-PRAXiS

Delphi-PRAXiS (https://www.delphipraxis.net/forum.php)
-   Programmieren allgemein (https://www.delphipraxis.net/40-programmieren-allgemein/)
-   -   Berechnen, wann eine Platte keinen Speicherplatz mehr hat ?? (https://www.delphipraxis.net/116595-berechnen-wann-eine-platte-keinen-speicherplatz-mehr-hat.html)

RWarnecke 2. Jul 2008 20:34


Berechnen, wann eine Platte keinen Speicherplatz mehr hat ??
 
Hallo zusammen,

ich brauche mal einen Denkanstoß. Mein Programm Zeus überwacht den Speicherplatz von Servervolumes. In der neuen Version zeichne in einem LOG-File in bestimmten Abständen auf, wieviel Speicherplatz belegt ist und wieviel Frei ist. Die Abstände werden in Minuten angegeben und können vom User selber gewählt werden. So nun ist die Frage, wie berechene ich nun den ungefähren Zeitpunkt, wann das Volume keinen speicherplatz mehr hat ?

Dax 2. Jul 2008 20:36

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Du nimmst dir die letzen X Samples und rechnest darauf das Füllstandsdelta pro Zeit aus. Dann teilst du den freien Speicherplatz durch das Ergebnis und wandelst alles in eine sinnvolle Zeiteinheit um - fertig.

RWarnecke 2. Jul 2008 20:47

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von Dax
Du nimmst dir die letzen X Samples und rechnest darauf das Füllstandsdelta pro Zeit aus.

Den Satz kapiere ich irgendwie nicht. Ich habe zum Beispiel folgendes LOG-File: (Angaben in KB)
Zitat:

02.07.2008 - 20:00 - 10000000
02.07.2008 - 20:20 - 9500150
02.07.2008 - 20:40 - 9300000
02.07.2008 - 21:00 - 9250000
02.07.2008 - 21:20 - 9245000
02.07.2008 - 21:40 - 9500000
02.07.2008 - 22:00 - 9450345
02.07.2008 - 22:20 - 9300000
02.07.2008 - 22:40 - 9245000
02.07.2008 - 23:00 - 11000000
02.07.2008 - 23:20 - 10900400
02.07.2008 - 23:40 - 10850000
02.07.2008 - 00:00 - 10850450
02.07.2008 - 00:20 - 10700000
02.07.2008 - 00:40 - 10000000
Ich habe hier ja ein auf und ein ab, weil ja mal was gespeichert wird und mal etwas gelöscht wird. Ich habe da keinen Plan, wie ich das in eine vernünftige Formel oder so packen kann. Woher weiß ich jetzt, wann meine Platte ungefähr voll ist ?

Bernhard Geyer 2. Jul 2008 20:50

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Bei diesen Start und Zielwerten wird die Platte nie voll.

RWarnecke 2. Jul 2008 21:01

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von Bernhard Geyer
Bei diesen Start und Zielwerten wird die Platte nie voll.

Ok, ist vielleicht ein schlechtes Beispiel. Das hier müsste aber besser passen :
Zitat:

02.07.2008 - 20:00 - 10000000
02.07.2008 - 20:20 - 9500150
02.07.2008 - 20:40 - 9300000
02.07.2008 - 21:00 - 9250000
02.07.2008 - 21:20 - 9245000
02.07.2008 - 21:40 - 9500000
02.07.2008 - 22:00 - 9450345
02.07.2008 - 22:20 - 9300000
02.07.2008 - 22:40 - 9245000
02.07.2008 - 23:00 - 9250000
02.07.2008 - 23:20 - 9249900
02.07.2008 - 23:40 - 9245934
03.07.2008 - 00:00 - 9243456
03.07.2008 - 00:20 - 9234700
03.07.2008 - 00:40 - 9233400
03.07.2008 - 01:00 - 9220000
Jetzt geht ja die Kurve deutlich nach unten. Ist das ein besseres Beispiel ?

taaktaak 2. Jul 2008 21:11

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Moin, Moin.
Ich denke, das diese Werte insgesamt recht gut zeigen, wie gewagt solche Prognosen sind. Eine "allgemeingültige Prognoseformel" kann es hier wohl nicht geben. Nutzungsbedingungen können sich ändern, die Formel müsste in gewisser Weise lernfähig sein. Grundsätzlich sollte es aber möglich sein einen Trend der Speicherbelegung zu bestimmen - also so etwas wie Dax es schon erwähnt hat. Und dieser Trend müsste regelmäßig neu berechnet werden.

r2c2 2. Jul 2008 21:17

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Das sind zu wenig Daten für ne gescheite Prognose. Ich nehm mal an, dass du da eher an Wochen und Monate, als an Minuten und Stunden denkst. Zumindest will ich nicht hoffen, dass deine Platten so schnell voll werden.

==> Nimm dir also mal die Log-Einträge der letzen sagen wir mal 4 Wochen. Jetzt gibt es mehrere Möglichkeiten, was du machen kannst. Auf jeden Fall solltest du dir aber mal die Methode der kleinsten Quadrate angucken. Damit kannst du dann z.B. linear extrapolieren.

Das lässt sich natürlich noch beliebig verkomplizieren. z.B. könnte man neue Werte stärker gewichten als alte, Werte zusammenfassen um zusätzlich den Effekt von Ausreißern weiter einzuschränken, etc. Für den Anfang sollte es aber reichen einfach linear zu extrapolieren...

mfg

Christian

RWarnecke 2. Jul 2008 21:22

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von taaktaak
Moin, Moin.
Ich denke, das diese Werte insgesamt recht gut zeigen, wie gewagt solche Prognosen sind. Eine "allgemeingültige Prognoseformel" kann es hier wohl nicht geben. Nutzungsbedingungen können sich ändern, die Formel müsste in gewisser Weise lernfähig sein. Grundsätzlich sollte es aber möglich sein einen Trend der Speicherbelegung zu bestimmen - also so etwas wie Dax es schon erwähnt hat. Und dieser Trend müsste regelmäßig neu berechnet werden.

Ok, das habe ich jetzt verstanden. Mir war ja von anfang an klar, dass ich keinen genauen Zeitpunkt sagen kann. Aber wie berechne ich nun den Trend anhand meines zweiten Beispiels ? Muss ich dazu nur die 10000000 KB - 9220000 KB rechnen. Dann weiß ich das in 5 Stunden sich der Speicherplatz um 780000 KB verringert hat. Mein Volume hat aber noch einen freien Speicherplatz von 5000000 KB um 01:00 Uhr. Muss ich dann jetzt (5000000 KB / 780000 KB) * 5 Stunden rechnen ? Wenn ja, wäre es dann richtig, dass das Volume in ca. 32 Stunden voll ist, wenn der Trend so weitergeht ?

taaktaak 2. Jul 2008 21:32

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Uhhh, bei der Hitze zu so später Stunde so viele Nullen - hihihihi. Ich kürz mal ab 78...KB/5h = -25...KB/h, also 5000..KB / 25.. KB/h -> in 2.... h ist FINITO.

RWarnecke 2. Jul 2008 21:43

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von taaktaak
Uhhh, bei der Hitze zu so später Stunde so viele Nullen - hihihihi. Ich kürz mal ab 78...KB/5h = -25...KB/h, also 5000..KB / 25.. KB/h -> in 2.... h ist FINITO.

Wie kommst Du hier auf die -25...KB/h ? Wenn ich hier den einfach 3-Satz anwende komme ich auf einen ganz anderen Wert. Ich glaube ich mache für heute Schluss, denn ich blicke gerade garnichts mehr. Werde mich aber morgen nochmal dahinter klemmen.

taaktaak 2. Jul 2008 21:45

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Uhhhh, diesem Rat sollte ich auch folgen: 78/5 ergibt natürlich NICHT 25
- Gute Nacht!

r2c2 2. Jul 2008 22:00

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Lies nochmal, was ich geschrieben hab.
a) bei so nem kurzen Zeitraum sind die Schwankungen viel zu groß. Du wirst extrem ungenau.
b) halte dich nicht an Samples, sondern an Daten(im Sinne von Datum) fest. Du willst ja nicht sagen "in x Samples ist die Platte voll", sondern in x Tagen
c) nur den ersten und den letzten Wert nehmen ist nicht so gut. Ausreißer können das Bild erheblich verzerren. Angenommen du hast beim letzten Wert gerade eine große Datei auf der Platte gehabt, die gleich danach wieder runtergeflogen ist. Dann würde dein Verfahren annehmen, dass die drauf bleibt und noch schlimmer: alle x Tage( bzw. momentan alle x Stunden) so eine dazukommt...

==> Methode der kleinsten Quadrate
Gucks dir mal an. Wobei ich zugeben muss, dass es in der Wikipedia nicht gerade einfach beschrieben ist. Da muss ich mich auch erst wieder reindenken. Such einfach mal nach "Methode der kleinsten Quadrate" und "Regression" und versuch dabei Uni-Seiten aus dem Weg zu gehen. :zwinker:

mfg

Christian

Medium 2. Jul 2008 22:14

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Eine (nonlineare) Regressionsanalyse dürfte die besten Prognosen auf reiner Datenbasis liefern, ob der Aufwand aber gerechtfertigt ist kann ich nicht abschätzen. Evtl. reicht auch eine lineare, aber man kann machen was man will, man hat immer die Chance extrem daneben zu liegen.
Eine Regressionsanalyse kann hübscherweise aber auch aussagen, mit welcher Wahrscheinlichkeit die Platte zum Datum X voll sein wird :)

p0w3r5tr34m3r 2. Jul 2008 23:29

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
man könnte doch auch "einfach" den durchschnitt berechnen und diese Gleichung dann immer wieder mit den aktuellen werten erweitern um einen ungefähren Zeitraum bestimmen zu können...
Wäre so mein erster Gedanke dazu :-)

mfg

littleDave 2. Jul 2008 23:39

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Also ich würd das ganze einfach per Durchschnitt berechnen:

Sagen wir, ich habe nun folgende LogDaten
Code:
Tag       Freier Platz in GB
1          100
2           95
3          103
4           20
5           78
Jetzt würd ich den Durchschnitt der einzelnen Differenzen bilden, also
Code:
(
    (100 -  95)
  + ( 95 - 103)
  + (103 -  20)
  + ( 20 -  78)
) / 4
Jetzt kenn ich die Durchschnittliche Änderung: +5,5. Wenn der Durchschnitt [bei meiner Rechnung] negativ ist, steigt der freie Speicherplatz, ist der positiv, sinkt er.

Nun haben wir die Formal 78 - x*5.5 = 0 => x = 78 / 5.5
x ist die Dauer in Tagen, bis die Platte voll ist. Ist x negativ, wird sie "nie" voll.

// Edit: Roter Kasten ist wohl schon im Bett :feuerchen:

taaktaak 3. Jul 2008 07:12

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Moin, Moin.
Na, das beruhigt mich ja nun doch etwas. Abgesehen, dass mein Divisionsergebnis gestern Abend ein wenig geschwächelt hatte: Bei 78/5 waren wir doch auch schon gelandet. Als Schnellschuss aus der Hüfte also gar nicht mal so schlecht.

Khabarakh 3. Jul 2008 11:32

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
@taaktaak & littleDave: Euer Ansatz ist wirklich alles andere als optimal, worauf r2c2 ja schon hingewiesen hat:
Zitat:

Zitat von r2c2
nur den ersten und den letzten Wert nehmen ist nicht so gut. Ausreißer können das Bild erheblich verzerren. Angenommen du hast beim letzten Wert gerade eine große Datei auf der Platte gehabt, die gleich danach wieder runtergeflogen ist. Dann würde dein Verfahren annehmen, dass die drauf bleibt und noch schlimmer: alle x Tage( bzw. momentan alle x Stunden) so eine dazukommt...

Least Squares dürfte auf jeden Fall bessere Ergebnisse liefern und ist linear auch noch nicht allzu komplex, siehe die dritte Formel hier. In dem Beispiel direkt darunter wird auch ihre Anwendung dargestellt.

taaktaak 3. Jul 2008 11:40

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
@Khabarakh - keine Frage!
Dieser Ansatz ist wohl die absolute Minimallösung. Sie konkretisiert ja lediglich die ersten Gedanken von Rolf. Natürlich sollten die Hinweise von r2c2 weiterverfolgt werden.
Wäre schon interessiert zu erfahren, in welchem Maße eine anspruchsvollere Berechnungsmethode die Prognosegenauigkeit erhöhen kann.

littleDave 3. Jul 2008 12:19

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Jetzt bin ich auch neugierig geworden ;-). Ich habe mal geschaut, wie "ungenau" die Durchschnittsmethode im Vergleich zur "kleinsten Quadrate" - Methode ist.

Dafür hab ich das Beispiel beim Link von Khabarakh durchgerechnet (natürlich mit einem schnell geschriebenen Delphi-Programm ;-)):
Zuerst habe ich einmal den Durchschnitt der Quotienten von "Schiffbreite / Schifflänge" ausgerechnet. Dabei kommt bei der Durchschnittsrechnung ein Faktor von 0.10624 raus (beim Wikipedia-Beispiel "kleinsten Quadrate": 0.1612)

Jetzt hab ich Anhand der Schiffslängen versucht, die Breite zurückzurechnen. Dabei entstehen natürlich Fehler. Nun habe den Durchschnitt der Abweichungen genommen sum("berechnete Breite - wirkliche Breite") / n und folgendes kam heraus:

Code:
Methode               |  Durchschnittliche Abweichung
------------------------------------------------------
simpler Durchschnitt  |        -0.58 Meter
kleinsten Quadrate    |         8.64 Meter
Das find ich jetzt total interessant, dass die simple Durchschnittsmethode "genau" ist, als die der kleinsten Quadrate. Jetzt ist natürlich die Frage: ist das Beispiel nur schlecht gewählt bzw. eignet sich die Methode für das Anwendungsbeispiel nicht? Oder hab ich mir ganz einfach nur verrechnet?

p80286 3. Jul 2008 16:18

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Hallo zusammen,

ich finde Ihr quält die gute alte Mathematik zu sehr. Wie war das mit den zwei Eimern und der durchschnittlich optimalen Temperatur?

Wenn ich die Ausgangsfragestellung richtig verstanden habe, geht es um einen (File-)Server auf dem verschieden Benutzer ihre Dateien ablegen. Da frage ich zuerst was für Dateien? Viele Word-Dokumente sind so zwischen 300k und 5Mb groß. Wenn die Benutzer die 5Mb-Obergrenze noch nicht geknackt haben, würde ich als Meldegrenze für den freien Plattenplatz ungefähr diese Grenze definieren:

5Mb * 2 * Anzahl Benutzer

So etwas klappt natürlich nur wenn alle Leute sich in einem engen Rahmen bewegen. Ein paar bösartige Chaoten, die mal schnell eine Video-DVD auf den Server packen, lassen die Meldeschwelle natürlich heftig ansteigen.

Ich empfehle zu analysieren was für Daten auf dem Server liegen und ob es Relationen zwischen der Größe und der "Bewegungshäufigkeit" gibt. Werden vor allem kleine(re) Dateien gespeichert und gelöscht sollte ein Durchschnittswert genügend Sicherheit geben. Sind für die Bewegung aber vor allem gößere Dateien verantwortlich sollte nur sie für die Abschätzung der Sicherheitsmarge genutzt werde.

Nebenbei gefragt, gibt es Beziehungen zwischen Wochentagen und den Dateibewegungen? Zum Quartalsende noch einmal richtig Daten produzieren?

Und meiner Meinung ganz wichtig, wann soll den "gewarnt" werden?
5 Tage bevor es knallt, weil der Lehrling noch schnell eine neue Platte holen muß?
Oder reichen 2 Stunden, weil der Admin schon alles für die Kapazitätserweiterung in der Schublade hat?

Im ersten Fall sollte die Schätzung sehr vorsichtig ausfallen, um genügend Sicherheit zu haben. Im zweiten Fall knirscht es mal kurz und das Leben geht weiter.
(Bitte keinem Anwender erzählen!)

Gruß
K-H

r2c2 3. Jul 2008 17:12

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
@littleDave:
ich hab jetzt nicht nachgerechnet, aber ich geh mal davon aus, dass du dich nicht verrechnet hast. Allerdings hast du einen Denkfehler:
Deine Methode zum ermitteln des "besseren" Ergebnisses passt genau zu deinem Algorithmus, nicht aber zur Methode der kleinsten Quadrate. Mit deinem Ansatz minimierst du direkt die durchschnittliche Abweichung. Deshalb ist dein Algo da auch mehr oder weniger unschlagbar. Die Methode der kleinsten Quadrate minimiert aber gerade nicht die durchschnittliche Abweichung, sondern die Abweichungsquadrate. Rechne mal die aus und du wirst sehen, dass dein Algo da deutlich schlechter abschneidet. Ganz einfach weil dieses Kriterium direkt zur Methode der kleinsten Quadrate passt. Da is die per Definition unschlagbar.

@p80286:
Zitat:

Wie war das mit den zwei Eimern und der durchschnittlich optimalen Temperatur?
Sagt mir nix.

Zitat:

5Mb * 2 * Anzahl Benutzer
Wie kommst du auf die Formel? Kann ich nicht nachvollzeihen.

Jedenfalls hat deine Methoden den Nachteil, dass sie erfordert auf die jeweilige Situatuion(große/kleine Dateien, etc. wie du es schon beschrieben hast) angepasst wedren muss. Alle anderen bisher diskutierten Lösung interessiert das alles aber gar nicht. Die müssen nicht maßgeschneidert werden. Sie funktionieren einfach. Und genau das macht die Mathematik: Allgemeine Lösungen liefern. Nichts Zurechtgezimmertes, das man mit der Nagelschere auf die Anforderungen maßschneidern muss für dann zu hoffen, dass sich ja nix an den Bedingungen ändert...

mfg

Christian

RWarnecke 3. Jul 2008 17:20

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von p80286
So etwas klappt natürlich nur wenn alle Leute sich in einem engen Rahmen bewegen. Ein paar bösartige Chaoten, die mal schnell eine Video-DVD auf den Server packen, lassen die Meldeschwelle natürlich heftig ansteigen.

Ich empfehle zu analysieren was für Daten auf dem Server liegen und ob es Relationen zwischen der Größe und der "Bewegungshäufigkeit" gibt. Werden vor allem kleine(re) Dateien gespeichert und gelöscht sollte ein Durchschnittswert genügend Sicherheit geben. Sind für die Bewegung aber vor allem gößere Dateien verantwortlich sollte nur sie für die Abschätzung der Sicherheitsmarge genutzt werde.

Nebenbei gefragt, gibt es Beziehungen zwischen Wochentagen und den Dateibewegungen? Zum Quartalsende noch einmal richtig Daten produzieren?

In dem Programm gibt es einen grünen, einen gelben und einen roten Bereich. Die gelben und roten Bereiche kann der Admin selber über eine Größenangabe in KB oder prozentual von der Gesamtgröße angeben. Alles was dann größer als der gelbe Bereich ist, ist dann der grüne Bereich. Das sind die Warnhinweise, die das Programm schonmal ausgibt. Nun wollte ich auch eine eventuelle Warnmeldung anhand diesem Vorschlag ausgeben :
Zitat:

Zitat von Grakvaloth
2. Warnmedungen könne Automatisch geregelt werden (Das Program beobachtet bzw. fürt einen 1 Monatz log über die größenveränderung, und ermitelt so eine art Deadline bis die Platte voll wird, dem entsprechend warnt es einem den in so und so viel tagen.)

So, dazu brauche ich ja die Berechnung des Trends und/oder vielleicht der Wahrscheinlichkeit, wann die Platte entweder voll ist oder in einen der Bereiche kommt. Dazu hatte ich mir überlegt, der Admin stellt ein, dass die Größe des freien und des belegten Speicherplatzes ein einem bestimmten Abschnitt aufgezeichnet wird. So kommen jetzt in der Aufzeichnung so große Brocken vor, wie es hier
Zitat:

Zitat von p80286
Ein paar bösartige Chaoten, die mal schnell eine Video-DVD auf den Server packen, lassen die Meldeschwelle natürlich heftig ansteigen.

geschrieben hat, habe ich ja natürlich auf einmal einen klaren und deutlichen Anstieg des belegten Speicherpatzes. Dieses sollte dann ausgegeben werden, mit dem Hinweis, dass wenn es so bleibt die Platte in x Tagen voll ist und kein Speicherplatz mehr da ist.

Die andere Vairante ist, dass wenn das Programm meldet, das ein Volume in den gelben oder roten Bereich kommt, dann soll es noch zusätzlich anhand einer Berechnung ausgeben, das in ca. x Tagen das Volume voll ist.

Dafür brauche ich die Berechnung. Da ich nie Mathe studiert habe oder in der Oberstufe auf'm Gymnasium war, bin ich da etwas hilflos mit den Formeln, von dem Link zu der Methode der kleinsten Quadrate. Ich habe mir das zwar durchgelesen, aber meistens nur Bahnhof verstanden. Könnte mir bitte daher jemand die Formel oder den Mathematischen Weg erklären anhand eine Beispiels, wie ich da zu einem Ergebnis komme.

Dann noch eine Frage, wieviele Werte muss ich haben, um für mein Vorhaben eine einigermaßen vernüftige Berechnung anzustellen ?

p80286 3. Jul 2008 17:52

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
@r2c2
Du hast zwei Eimer.
Beide haben das gleiche Volumen.
Beide sind mit Wasser gefüllt.
Im einen ist die Temperatur ca 80 Grad Celsius im anderen ca 0 Grad Celsius.

"Statistisch gesehen hat man dan eine angehme Temperatur für ein Fußbad."

OK ist ein wenig platt, zeigt aber , daß Du ohne eine hinreichend große Anzahl von Stichproben mit der Statistik keine vernünftige Aussage treffen kanst.

Zitat:

5Mb * 2 * Anzahl der Benutzer
Jetzt erschlägst Du mich, aber ich hatte auch einmal das Vergnügen einen File-Server zu betreuen. Wir haben uns die Mühe gemacht und ein wenig Statistik betrieben und sind durch die gemachten Erfahrung bei den obigen Werten gelandet. 5Mb war damals die wahrscheinliche Maximalgröße der Datei, mit nocheinmal 5MB als Sicherungszuschlag und Anzahl der Benuter, da die 30 Leute, die den Server genutzt haben, doch recht chaotisch agierten.

Also es kommt darauf an wofür Du es brauchst. Eine IBM-Serverfarm (viele Stichproben) fährt mit der Statistik ganz gut, bei einer relativ kleinen Installation (wenige Stichproben) mußt Du eine "weiche" Korrektur einführen. Oder anders ausgedrückt lautet die Frage, kannst Du aus den Vergangenheitswerten die Zukunft hinreichend genau abschätzen und mögliche Verhaltensänderungen beachten?

Gruß
K-H

r2c2 4. Jul 2008 20:56

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von p80286
Du hast zwei Eimer.
Beide haben das gleiche Volumen.
Beide sind mit Wasser gefüllt.
Im einen ist die Temperatur ca 80 Grad Celsius im anderen ca 0 Grad Celsius.

"Statistisch gesehen hat man dan eine angehme Temperatur für ein Fußbad."

OK ist ein wenig platt, zeigt aber , daß Du ohne eine hinreichend große Anzahl von Stichproben mit der Statistik keine vernünftige Aussage treffen kanst.

Nö. Das zeigt das nicht. Wenn du mehr Eimer hast, is die Schlussfolgerung(perfekte Temperatur) immer noch falsch. Das Beispiel zeigt nur, dass man aus dem arithmetischen Mittel nicht Aussagen herauslesen sollte, die nicht gelten...

Mit der Anzahl der Stichprobem hast du aber natürlich vollkommen Recht. Hab ich oben ja auch schon erwähnt.

Zitat:

Zitat:

5Mb * 2 * Anzahl der Benutzer
Jetzt erschlägst Du mich, aber ich hatte auch einmal das Vergnügen einen File-Server zu betreuen. Wir haben uns die Mühe gemacht und ein wenig Statistik betrieben und sind durch die gemachten Erfahrung bei den obigen Werten gelandet. 5Mb war damals die wahrscheinliche Maximalgröße der Datei, mit nocheinmal 5MB als Sicherungszuschlag und Anzahl der Benuter, da die 30 Leute, die den Server genutzt haben, doch recht chaotisch agierten.
Also eine rein empirische Formel. Wie gesagt: Das Ergebnis mag ganz gut sein, aber ich hab keine Chance das irgendwie einzuschätzen, zu sagen unter welchen Umständen die Formel brauchbare Ergebnisse liefert, wo es zuu Problemen kommt und überhaupt in welchen Fällen die Formel überhaupt anwendbar ist. Vielleicht sorgt schon eine marginale Umstellung der Verhaltensweise der User oder Ähnliches dafür, dass die Formel schlechte Ergebnisse liefert. Das Einzige, was man aussagen kann ist, dass die Formel in diesem einen konkreten Fall ganz gute Ergebnisse gezieht hat. Alles weitergehende ist Physikerinduktion[1]... :zwinker: Von gewissen Algorithmen kann man aber entsprechende Eigenschaften nachweisen[2].
Sofern sich das Verfahren also nicht eideutig in mehreren weiteren Fällen als brauchbar erweist, wäre es zumindest mir viel zu unsicher.

Zitat:

Oder anders ausgedrückt lautet die Frage, kannst Du aus den Vergangenheitswerten die Zukunft hinreichend genau abschätzen und mögliche Verhaltensänderungen beachten?
In gewissem Maße, ja.

@RWarnecke:
Zitat:

Da ich nie Mathe studiert habe oder in der Oberstufe auf'm Gymnasium war, bin ich da etwas hilflos mit den Formeln
Gut, das kann ich nachvollziehen. Das in der Wikipedia ist Größtenteils wirklich auf Uni-Niveau geschriebnen. Wobei das Verfahren an sich nicht soo schwer ist. Wobei das Verfahren an sich nicht so schwer ist. Trotzdem wird es wohl schwer es dir zu erklären, wenn du keine Oberstufenmathe(insbesodnere Analysis) hattest. Da müsste ich es so praktisch selbst implemetieren. Aber das haben auch schon andere getan. Google förderte z.B. folgendes zu Tage:
http://members.fortunecity.com/schut...wnload/de.html
Gut, das steht jetzt unter GPL, inwieweit es also für dich interessant ist(und wie gut es ist; hab mirs nicht näher angeguckt). Wobei ich nicht denke, dass es die einzige Implementietrung ist. Such einfach mal.

Alternativ kannst du natürlich auch eine der anderen hier angesprochenen Lösungswege gehen. Die sind allesamt einfacher, wenngleich das Ergebnis etwas "schlechter" sein dürfte. Über die Vor- und Nachteile haben wir ja diskutiert...


[1] Wer das nicht kennen sollte: Physiker: "Alle ungeraden Zahlen sind Primzahlen. Beweis: 3 ist prim, 5 ist prim 7 ist prim, 9 ist.... äh.... Messfahler, 11 ist prim, 13 ist prim... Passt!"
[2] Was nicht heißt, dass ich jetzt Zeit oder Lust dazu hätte. Beweis dur Lehrbuch: Entsprechende Beweise lassen sich in den einschlägigen Werken nachlesen. qed

mfg

Christian

Medium 4. Jul 2008 21:29

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Ich werfe noch einmal die Regressionsanalyse in den Raum, wobei eine eigene Umsetzung mit Sekundarstufe 1 Mathe und in weniger als ein paar Wochen für eine Einzelperson eher unwahrscheinlich ist. Dennoch ist dies ein Verfahren, dass sich für eine völlig abstrakte Extrapolation rein auf Daten beziehend die besten Werte liefern kann[1].

Ein weniger komplizierter Weg zu etwas ähnlichem kann evtl. auch so aussehen:
Du nimmst Messwerte aus der Vergangenheit, und trägst sie grafisch in ein Koordinatensystem ein (Freier Speicher, jede Stunde z.B.). Dann schaust du dir den Verlauf an, und vergleichst es mit Verläufen von diversen Standardfunktionen (Parabel, Exponentialfunktion, Gerade, Sinus, etc.). Die ähnlichste Funktion schnappst du dir, und drehst an ihren Parametern so, dass die Funktion wenn sie in das Koordinatensystem eingetragen wird, möglichst überall ausreichend nah an den Messwerten liegt. (Hier und da kann man dann noch weitere Funktionen "aufmodulieren" um das zu verbessern. Bsp.: Eine wellig verlaufende Linie wird wohl besser von etwas der Form "y=a*x+sin(x)" beschrieben, als nur von "y=a*x".) Von da an kannst du Extrapolieren.
Nachteil: Man schätzt eine Schätung -> es ist schon noch irgendwo "Gefummel", und man benötigt Messdaten aus der Vergangenheit. Je mehr desto besser!
So in etwa arbeitet die Regressionsanalyse, nur wird dabei noch die Güte der Schätzung in Zahlen bewertet, man kann Wahrscheinlichkeiten für Wertebereiche ermitteln, und, und das ist die eigentliche Stärke, man kann mehr als nur eine Einflussgröße verwenden (also mehr als wie hier die vergangene Zeit z.B.) - wobei man hier vermutlich schwer weitere in Zahlen ausdrückbare Konditionen finden kann, die die Schätzung wirklich verbessern.


Allerdings habe ich ebenfalls die Erfahrung gemacht, dass es sich gerade bei solchen Problemen herausstellt, dass empirische Modelle (wie von p80286 vorgeschlagen) meistens die Nase deutlich vorne haben, sowohl in Genauigkeit der Vorhersagen, als auch vor allem in der Zeit in der man sie implementiert hat! Und was ist schlimm daran eine Speziallösung zu entwickeln, wenn es nur für einen Kunden ist? Der WILL ja schließlich eine Speziallösung, sonst bräuchte er den TE nicht um sie zu schreiben. Damit komme ich zum Fazit: Du kannst gerne mit diversen mathematischen Verfahren rumtesten, es ist ein total interessantes Themengebiet, aber wenn du eine praktikable Lösung zeitnah zum Kunden tragen willst, dann besorg dir Messwerte und gehe ähnlich wie p80286 vor.

Ich bin ja auch ein Fan von möglichst allgemeinen Lösungen, Mathe insbesondere, und einfach "schönen" Konstrukten. Aber in der "realen Welt" gehts halt darum, dass es klappt, und das nicht erst nächstes Weihnachten. Ich muss mich da aber auch regelmäßig von meinem Chef auf den Teppich runter zerren lassen ;).


[1] "Kann", da es noch auf die Wahl der Funktionsbasis ankommt, und auch noch auf die Skalierung und Verteilung der Basisdaten.

omata 4. Jul 2008 21:44

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von Medium
Ein weniger komplizierter Weg zu etwas ähnlichem kann evtl. auch so aussehen...

klick

RWarnecke 6. Jul 2008 08:50

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von Medium
Allerdings habe ich ebenfalls die Erfahrung gemacht, dass es sich gerade bei solchen Problemen herausstellt, dass empirische Modelle (wie von p80286 vorgeschlagen) meistens die Nase deutlich vorne haben, sowohl in Genauigkeit der Vorhersagen, als auch vor allem in der Zeit in der man sie implementiert hat!

Das Programm muss nicht für irgendein Kunden so schnell wie möglich fertig werden. Da ich das Programm der Allgemeinheit als Freeware zur Verfügung stellen will, kann ich mit dem Weg von p80286, so ich das Verstanden habe, nicht nutzen oder ?

Medium 6. Jul 2008 13:24

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Mh, okay, dann muss es wohl in der Tat so generisch wie möglich sein. Ich weiss grad nicht, wie ich darauf gekommen bin, dass es eine Speziallösung sein sollte :oops:

Da wird es dann aber echt kompliziert. Stelle sir folgendes Szenario vor:
Datum 1: 200 GB frei
Datum 2: 310 GB frei
Datum 3: 120 GB frei
Datum 4: 230 GB frei

Sowas kann man nun durch eine leicht steigende sinusartige Funktion annähern, wodurch die Platte recht spät voll würde, oder man kann es über ein Polynom 3. Grades annähern, wo die Schätzung erheblich eher eine volle Platte postulieren würde. Die zwei vorhersagen wären so sehr unterschiedlich, dass sie keine sinnvolle Information mehr enthält.

In dem Fall könnte ich es mir fast noch vorstellen, dass ein N-Tage Durchschnitt nicht übel ist. Extrapolieren würde ich dann über eine Gerade, die durch die Durchschnittskurve eine Sekante bildet, die beim letzten Wert, und dem Wert vor N Tagen schneidet. Die Varianz der Geraden zu den real gemessenen Werten in diesem Zeitraum könnte man dann zu einer Angabe verwursten, wie wahrscheinlich das Vollwerden zu einem Zeitpunkt ist.
Aber das ist auch eher eine Methode, die ich mir gerade ausgedacht habe, die vermutlich keine mathem. nachweisbare Qualität besitzt. Ich kann mir lediglich vorstellen, dass das in vielen Fällen sinnvolle Werte ergibt. Feintunen kann man dann über die Wahl von N, und man könnte bei großen N überlegen, ob man aktuellere Tage nicht stärker gewichtet als weiter vergangene, so dass man auch noch über eine Gewichtungsfuntkion tunen kann. Das ist dann Ausprobieren :)

RWarnecke 6. Jul 2008 14:00

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Zitat:

Zitat von Medium
Mh, okay, dann muss es wohl in der Tat so generisch wie möglich sein. Ich weiss grad nicht, wie ich darauf gekommen bin, dass es eine Speziallösung sein sollte :oops:

Das ist nicht schlimm, ich hatte es bis dato ja auch nicht erwähnt. Aber würdest Du gerne ein Programm nutzen, was Dir halbwage Aussagen macht ?
Mir ist ja auch klar, das ich nie eine korrekte Aussage machen kann.

Da das ja alles nicht so einfach ist, ist vielleicht das Anzeigen der Tendenz einfacher zu Berechnen und anzuzeigen ? Das ich im Grunde nur anzeige, in welche Richtung mein freier Speicherplatz geht, ob nach oben oder unten oder stagniert.

Medium 6. Jul 2008 15:45

Re: Berechnen, wann eine Platte keinen Speicherplatz mehr ha
 
Liste der Anhänge anzeigen (Anzahl: 1)
Das ist ja, was ich mit meiner beschrieben Idee versuche. Ich hab das mal beispielhaft gebaut, und die angehängte Grafik verdeutlich evtl. was ich da vor hatte. Man muss nur etwas damit spielen, über welchen Zeitraum man den Durchschnitt bilden möchte. (Solche N-Tage Durchschnittslinien werden u.a. auch an der Bösre als Kursindikator herangezogen, neben natürlich anderen Analyseverfahren.)


Alle Zeitangaben in WEZ +1. Es ist jetzt 17:36 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024-2025 by Thomas Breitkreuz