|
![]() |
|
Popov
(Gast)
n/a Beiträge |
#1
@Dade
1.) Du arbeitest sehr kontraproduktiv (für dich). Man muss dir alles aus der Nase ziehen. Bis man endlich weiß was du haben willst sind entweder a.) Tage vergangen oder b.) man hat die Lust verloren. 2.) Du tust wenig um die Arbeit zu beschleunigen oder zu vereinfachen. Betrachte mal die TAG-Buttons oben über dem Textfeld. Da hätten wir zuerst die Grundformatierungsfunktionen wie Fett, Kursiv, Unterstrichen. Dann die Ausrichtung der Zeile. Dann gibt es die geordnete wie auch die ungeordnete Liste, sowie Einzug. Gehen wir weiter, denn nun wird es interessant: wir haben das ein Zitat-Tag-Button. Damit können wir einen Textbereich schnell und leicht als Zitat anzeigen. Wunderbar ist auch der Code-Tag. Der sorgt dafür, dass Daten mit gleicher Buchstabenbreite angezeigt werden. Für Daten wie du sie hier ständig lieferst geradezu prädestiniert. Und natürlich der Delphi-Tag. Etwas höher gibt es da noch eine Schriftgröße und sogar Farben. Hättest du dich fünf Minuten hingesetzt und dein Problem anschaulich gepostet, vermutlich hätten mehr Leute auf deine Problem eingegangen. Aber du kopierst Textbereiche und klatscht sie einfach hier unformatiert und unkommentiert rein. Wer will soll bitte fragen. 3.) Wer ist es der hier ein Problem gelöst haben will? Du oder die Anderen? Wenn du etwas willst, dann solltest du schnell lernen, dass wenn andere sich die Zeit nehmen, auch die etwas Zeit investieren solltest. Mit der Zeit meine ich, dass es in deinem Interesse liegt wenn man dein Problem versteht. Denn so wie es aussieht ist es ein simpler Parser den du brauchst. Das ist in einer halben Stunde programmiert. Aber du hast dich entschlossen mit dein Problem mit Minimalaufwand zu lösen. Das beste Beispiel ist, dass deine Anleidung ![]() Quelldateien und Ziel - EXCEL Tabelle befinden sich hier: (unter Beispiel)
... ![]() Fallnummer Lymphknoten: Dies ist der Name der Csv Datei, z.B LU 39893_12_1A
Lymphknotennummer: Dies ist die LK Nummer der verschiedenen LK’s in einer einzelnen Csv, bsp. LK_1_1 oder LK_1_2 bzw. LK_1, LK_2 oder LK_3 dies variiert in jeder Datei. Dies hängt davon ab ob von einem LK mehrere Schnitte (LK_1_1 oder LK_1_2) auf einem Objektträger oder verschiedene LK’s (LK_1, LK_2 oder LK_3) fixiert sind. Anzahl der Follikel: Dies ist die Summe der Follikel in LK_1 bzw. LK_1_1. Die Follikel sind gekennzeichnet als LK_1_1_F _1 Keimzentren vorhanden ja=1, nein=0: Keimzentren sind als LK_1_K_ gekennzeichnet ... |
![]() |
Registriert seit: 28. Feb 2011 Ort: Mannheim 1.384 Beiträge Delphi 10.4 Sydney |
#2
OK. Sorry Bud, aber das ist mir für lau echt zu aufwendig. Normalerweise fragt man hier im Forum eher <wie soll ich dies oder das machen> und nicht <kann das jemand für mich erledigen>? Ich selbst nehme keine Projekte an aber vielleicht stellt dein Kumpel hier mal eine Anfrage rein. Wird sich bestimmt jemand finden der es gegen Bezahlung übernimmt? Unter Umstanden wäre es auch einfacher die Daten mit einem Makro nach SPSS zu importieren.
LG Thomas |
![]() |
Registriert seit: 28. Apr 2008 Ort: Stolberg (Rhl) 6.659 Beiträge FreePascal / Lazarus |
#3
Bisher habe ich nur mitgelesen, aber langsam schwillt mir der Hals.
a) es gibt mehrere .CSV Dateien, die drei Spalten enthalten. Jede Spalte enthält Daten zu einem spezifischen Sachverhalt b) es gibt mehrere .CSV Dateien, die eine unterschiedliche Anzahl Spalten enthalten, wobei die Anzahl Spalten jeweils mit gleichen Inhalten korrespondieren. c) es gibt mehrere .CSV Dateien, die eine unterschiedliche Anzahl Spalten mit unterschiedlichen Sachverhalten enthalten. a) Füge eine Spalte mit dem Dateinamen ein, fertig. b) trenne die Daten nach Sachverhalt auf und füge jeweils eine Spalte mit dem Dateinamen ein. c) 42 Was ich bisher gelesen habe, scheint sehr für c) zu sprechen. der erste Schritt wäre es, zunächst einmal die vorliegenden Daten in eine "Normalform" zu bringen. Gruß K-H
Programme gehorchen nicht Deinen Absichten sondern Deinen Anweisungen
R.E.D retired error detector |
![]() |
Registriert seit: 18. Apr 2015 20 Beiträge |
#4
@Dade
1.) Du arbeitest sehr kontraproduktiv (für dich). Man muss dir alles aus der Nase ziehen. Bis man endlich weiß was du haben willst sind entweder a.) Tage vergangen oder b.) man hat die Lust verloren. ![]() 2.) Du tust wenig um die Arbeit zu beschleunigen oder zu vereinfachen.
Betrachte mal die TAG-Buttons oben über dem Textfeld. Da hätten wir zuerst die Grundformatierungsfunktionen wie Fett, Kursiv, Unterstrichen. Dann die Ausrichtung der Zeile. Dann gibt es die geordnete wie auch die ungeordnete Liste, sowie Einzug. Gehen wir weiter, denn nun wird es interessant: wir haben das ein Zitat-Tag-Button. Damit können wir einen Textbereich schnell und leicht als Zitat anzeigen. Wunderbar ist auch der Code-Tag. Der sorgt dafür, dass Daten mit gleicher Buchstabenbreite angezeigt werden. Für Daten wie du sie hier ständig lieferst geradezu prädestiniert. Und natürlich der Delphi-Tag. Etwas höher gibt es da noch eine Schriftgröße und sogar Farben. Hättest du dich fünf Minuten hingesetzt und dein Problem anschaulich gepostet, vermutlich hätten mehr Leute auf deine Problem eingegangen. Aber du kopierst Textbereiche und klatscht sie einfach hier unformatiert und unkommentiert rein. Wer will soll bitte fragen. ![]() 3.) Wer ist es der hier ein Problem gelöst haben will? Du oder die Anderen?
Wenn du etwas willst, dann solltest du schnell lernen, dass wenn andere sich die Zeit nehmen, auch die etwas Zeit investieren solltest. Mit der Zeit meine ich, dass es in deinem Interesse liegt wenn man dein Problem versteht. Denn so wie es aussieht ist es ein simpler Parser den du brauchst. Das ist in einer halben Stunde programmiert. Aber du hast dich entschlossen mit dein Problem mit Minimalaufwand zu lösen. Das beste Beispiel ist, dass deine Anleidung ![]() Quelldateien und Ziel - EXCEL Tabelle befinden sich hier: (unter Beispiel)
... ![]() Fallnummer Lymphknoten: Dies ist der Name der Csv Datei, z.B LU 39893_12_1A
Lymphknotennummer: Dies ist die LK Nummer der verschiedenen LK’s in einer einzelnen Csv, bsp. LK_1_1 oder LK_1_2 bzw. LK_1, LK_2 oder LK_3 dies variiert in jeder Datei. Dies hängt davon ab ob von einem LK mehrere Schnitte (LK_1_1 oder LK_1_2) auf einem Objektträger oder verschiedene LK’s (LK_1, LK_2 oder LK_3) fixiert sind. Anzahl der Follikel: Dies ist die Summe der Follikel in LK_1 bzw. LK_1_1. Die Follikel sind gekennzeichnet als LK_1_1_F _1 Keimzentren vorhanden ja=1, nein=0: Keimzentren sind als LK_1_K_ gekennzeichnet ... Ich hatte gedacht es wäre viel zu unübersichtlich, wenn ich die komplette Ziel - Excel - Datei hier poste. Auch habe ich versucht die Schritte in eigenen Worten darzustellen. Ich werde im folgenden Versuchen den Sachverhalt (mit viel Mühe) darzustellen. Ist ist aber echt kompliziert, wie ich finde, das macht es so schon schwer. Daher bitte ich um Nachsicht. Also noch einmal komplett: Für ein Projekt muss ich ca. 1500 csv - Dateien verarbeiten. Diese wurden mit einem Spezialprogramm erstellt und sind im Aufbau festgelegt. Sie sollen Analysiert und in anderer Form als EXCEL Tabelle gespeichert werden. Alleine schaffe ich das nicht, da ich Anfänger bin, aber das Projekt zeitnah schaffen muss. Per Hand ist das leider aussichtslos. Hier ein paar Infos: - Ursprungsdatei enthält immer drei Spalten - Alle drei Spalten sind unterschiedlich lang 1. Zeile - in der 1. Spalte/1. Zeile steht immer: Annotations 2. Zeile - in der 1. Spalte/2. Zeile steht immer: Name, in der 2. Spalte/2. Zeile steht immer:Perimeter (µm), in der 3. Spalte/2. Zeile steht immer: Area (µm2) 3. Zeile - ab der 3. Zeile beginnen die eigentlichen Daten - Die 3. Zeile/ 1. Spalte enthält Buchstaben/Zahlen Kombinationen, die das Vorhandensein verschiedener Körperzellen kodieren. Diese Werte können Vorkommen: ( X kann Werte von: 1-20 annehmen) [LK_X] z.B. LK_1, LK_2 Dies ist der Lymphknoten_1 [LK_X_X] z.B. LK_1_1, LK_1_2 Dies ist der Lymphknoten Nr. 1_1 [LK_X_X_X] z.B. LK_1_1, LK_1_2 Dies ist der Lymphknoten Nr. 1_1 [LK_X_F] z.B. LK_1_F Dies ist der entsprechende Follikel [LK_X_X_F] z.B. LK_1_1_F Follikel des Lymphknoten_1_1 [LK_X_X_X_F] z.B. LK_1_1_F Follikel des Lymphknoten_1_1 [LK_X_K_X] z.B. LK_1_K Keimzentrum des Lymphknotens [LK_X_X_K_X] z.B. LK_1_1_K Keimzentrum des Lymphknotens [LK_X_X_X_K_X] z.B. LK_1_1_1_K Keimzentrum des Lymphknotens [LK_X__K_R] z.B. LK_1_R_1 Lymphknoten mit regressiven, hyalinisierten Keimzentren (RHK) [LK_X_X_K_R] z.B. LK_1_1_R_1 Lymphknoten mit regressiven, hyalinisierten Keimzentren (RHK) [LK_X_X_X_K_R] z.B. LK_1_1_1_R_1 Lymphknoten mit regressiven, hyalinisierten Keimzentren (RHK) [Metastase_LK_X] z.B. Metastase_LK_1 Lymphknoten_1 enthält Metastase [Metastase_LK_X_X] z.B. Metastase_LK_1_1 Lymphknoten_1_1 enthält Metastase [Metastase_LK_X_X_X] z.B. Metastase_LK_1_1_1 Lymphknoten_1_1_1 enthält Metastase Nennen wir diese Spaltenwerte VARIABLE: VarLymph 3. Zeile/2. Spalte: (3z/1s) Perimeter (µm) VarUmfang 3. Zeile/3. Spalte: (3z/3s) Area (µm2) VarFläche Bearbeitungsprozess der Daten und Abspeichern als EXCEL Tabelle Jeweils soll pro .csv - Quelldatei ein Block von LK_X, darunter LK_X_X, darunter LK_X_X_X entstehen. Passend dazu soll jeweils der LK_X_F, darunter LK_X_X_F, darunter LK_X_X_X_F stehen. Passend dazu in einer anderen Spalte: LK_X_R_X, LK_X_X_R_X, darunter LK_X_X_X_R_X Jeder Lymphknoten hat eine feste Nummer. (z.B. LK_1_1). Korrespondierend soll in der identischen Zeile auch LK_1_1_F und LK_1_1_K_X stehen. 1. Spalte: Fallnummer Lymphknoten: Dateiname 2. Spalte: Lymphknotennummer: Inhalt: "VarLymph" (untereinander), wenn Lk_X 3. Spalte: Follikelnummer: Inhalt: "VarLymph" (untereinander) alle Lk_X_F / LK_X_X_F / LK_X_X_X_F 5. Spalte: Umfang Follikel: Inhalt VarUmfang4. Spalte: Anzahl der Follikel: Auftrittsanzahl der Lymphknoten mit Follikeln (alle Lk_X_F / LK_X_X_F / LK_X_X_X_F 5. Spalte: Keimzentren vorhanden ja=1, nein=0: Wenn irgend ein LK_X_K, LK_X_X_K, LK_X_X_X_K -> ja, sonst nein 6. Spalte: Anzahl der Keimzentren: Auftrittsanzahl der Lymphknoten mit Keimzenren (alle Lk_X_K / LK_X_X_K / LK_X_X_X_K) 7. Spalte: Anzahl der regressiven, hyalinisierten Keimzentren (RHK): Auftrittsanzahl der Lymphknoten mit RHK (alle Lk_X_K_R / LK_X_X_K_R / LK_X_X_X_K_R) 8. Spalte: Metastase: Alle VarLymph mit "Metastase" im Namen: Metastase_LK_X, Metastase_LK_X_X 9. Spalte: Umfang Metastase: Umfang der Metastase VarUmfang11. Spalte: Follikelnummer: Alle VarLymph mit F im Namen, wie LK_X_F, LK_X_X_F, LK_X_X_X_F 12. Spalte: Umfang Follikel: Umfang Follikel VarUmfang14. Spalte: Keimzentrumsnummer: Alle VarLymph mit F im Namen, wie LK_X_K, LK_X_X_K, LK_X_X_X_K, LK_X_K_R, LK_X_X_K_R, LK_X_X_X_K_R 15. Spalte: Umfang Keimzentrum: Umfang Keimzentrum VarUmfang Hier sind Beispieldateien: Quell -> Ziel - Beispiele ![]() Das müsste es sein. Ich hoffe sehr, dass es verständlich ist. Was meint ihr? Geändert von Dade ( 2. Mai 2015 um 07:27 Uhr) |
![]() |
Registriert seit: 29. Nov 2010 3.072 Beiträge Delphi 2010 Enterprise |
#5
Das müsste es sein. Ich hoffe sehr, dass es verständlich ist. Was meint ihr?
Was ich an der gesamten Anforderung nicht verstehe, ist die Maßgabe, csv Dateien in Exceldateien zu "konvertieren", damit sie mittels irgendeines Statistikprogramms untersucht / aufbereitet werden können. Was aber das "Ergebnis" des "Imports" hier scheinbar darstellt, ist bereits eine (erhebliche) Aufbereitung bzw. Auswertung der CSV Rohdaten! Ist es so oder sehe ich das falsch? Wenn es so ist, würde das bedeuten, dass die wissenschaftliche Arbeit auf Daten aufsetzt, die mittels der Handarbeit irgendeines Hiwis oder Forenmitglieds vorverarbeitet wurden, um es mal wertneutral auszudrücken. Es würde außerdem bedeuten, dass hier nicht von einem Import/Export die Rede ist, sondern von Datenverarbeitung bzw. Reporting, das vom Ansatz her nicht unbedingt geeignet ist, per prozeduraler Sprache umgesetzt zu werden. Was dann auch teilweise die "Komplexität" des Problems und Verwirrung allerseits erklären würde. Vielleicht kannst Du das gedachte Vorgehen noch einmal verdeutlichen, nicht Quell und Zielformat. Ich stelle mir das so vor (hab noch keine Doktorarbeit geschrieben): Irgendeine arme Wurst produziert mittels Point and Click Messdaten aus tausenden von Bildern. Das Programm spukt die Messdaten (Rohdaten) in einem etwas unpraktischen Format aus. Alle Messdatendateien müssen nun eingelesen werden und den Dateinamen als Datenmerkmal erhalten. Die Gesamtdaten müssen nun statistisch, wissenschaftlich aufbereitet und untersucht werden. Dazu wird ein Statistikprogramm verwendet, das scheinbar nur Exceldaten lesen kann. Die Aufbereitung der Daten (Plausibilisierung, Bereinigung, Analyse, Statistik) erfolgt in dem Statistikprogramm durch den Doktoranden oder einen wissenschaftlichen Mitarbeiter. Die Aufgabe hier würde also lauten: 1500 CSV Dateien um den Dateinamen anreichern als Merkmal anreichern und zu einer Excelliste zusammenfassen. Fertig. Was meinst Du?
Gruß, Jo
|
![]() |
Registriert seit: 18. Apr 2015 20 Beiträge |
#6
Das müsste es sein. Ich hoffe sehr, dass es verständlich ist. Was meint ihr?
Was ich an der gesamten Anforderung nicht verstehe, ist die Maßgabe, csv Dateien in Exceldateien zu "konvertieren", damit sie mittels irgendeines Statistikprogramms untersucht / aufbereitet werden können. Was aber das "Ergebnis" des "Imports" hier scheinbar darstellt, ist bereits eine (erhebliche) Aufbereitung bzw. Auswertung der CSV Rohdaten! Ist es so oder sehe ich das falsch? Wenn es so ist, würde das bedeuten, dass die wissenschaftliche Arbeit auf Daten aufsetzt, die mittels der Handarbeit irgendeines Hiwis oder Forenmitglieds vorverarbeitet wurden, um es mal wertneutral auszudrücken. Es würde außerdem bedeuten, dass hier nicht von einem Import/Export die Rede ist, sondern von Datenverarbeitung bzw. Reporting, das vom Ansatz her nicht unbedingt geeignet ist, per prozeduraler Sprache umgesetzt zu werden. Was dann auch teilweise die "Komplexität" des Problems und Verwirrung allerseits erklären würde. Vielleicht kannst Du das gedachte Vorgehen noch einmal verdeutlichen, nicht Quell und Zielformat. Ich stelle mir das so vor (hab noch keine Doktorarbeit geschrieben): Irgendeine arme Wurst produziert mittels Point and Click Messdaten aus tausenden von Bildern. Das Programm spukt die Messdaten (Rohdaten) in einem etwas unpraktischen Format aus. Alle Messdatendateien müssen nun eingelesen werden und den Dateinamen als Datenmerkmal erhalten. Die Gesamtdaten müssen nun statistisch, wissenschaftlich aufbereitet und untersucht werden. Dazu wird ein Statistikprogramm verwendet, das scheinbar nur Exceldaten lesen kann. Die Aufbereitung der Daten (Plausibilisierung, Bereinigung, Analyse, Statistik) erfolgt in dem Statistikprogramm durch den Doktoranden oder einen wissenschaftlichen Mitarbeiter. Die Aufgabe hier würde also lauten: 1500 CSV Dateien um den Dateinamen anreichern als Merkmal anreichern und zu einer Excelliste zusammenfassen. Fertig. Was meinst Du? Also, das "Aufbereiten" der Quelldateien ist nur ein winzig kleiner Teil der Arbeit. Diese Daten werden nämlich mit anderen Daten verglichen, die noch gesammelt werden müssen, jedoch mit einem anderen Programm, dass die Daten ebenfalls als .csv - Datei abspeichert. Jedoch wiederum anders. Daher muss eine der Ausgabe - CSV - Dateien dementsprechend angepasst werden. Erst danach fängt überhaupt die richtige Arbeit an. Als Ziel soll das Tool eine csv - Datei erstellen. In EXCEL Kann dies natürlich dann importiert werden. (Ist vielleicht etwas blöd beschrieben worden) Grundsätzlich beschreibst du genau den Ablauf. - Ein Programm gibt, nach Markierung tausender Stellen in tausenden Bildern, eine CSV - Datei aus. - Diese Datei kann in EXCEL importiert werden. Leider völlig falsch soritert. - Ein Tool soll nun den Dateinamen jeder Datei mit in die csv - Datei einfügen und die Daten etwas umstrukturieren. [wieso ihr nicht denken müsst, damit ist die Doktorarbeit erledigt] - Alle Bilder müssen per Hand unter dem Mikroskopt gemacht werden - Vorher natürlich die Proben von Patienten gesammelt, eingelegt, vorbereitet und geschnitten werden - Dann erfolgt natürlich noch die Färbung - Sichtung und Entscheidung welche Schnitte warum und wieso passend sind ( Das dauerte bis jetzt schon fast 2,5 Jahre ) - Diese Schnitte werden dann zusätzlich mit anderen Spezialprogrammen unter anderem Licht nach anderen Zellen untersucht (sehr aufwändig) - Anschließend diese Daten mit den bestehenden kombiniert in einer noch größeren Tabelle - Wenn das alles fertig ist, dann kommt die statistische Auswertung vom Statistiker Ihr seht, das Sortieren dieser 1500 CSV - Dateien ist wirklich nur etwas, das per Handarbeit Monate (neben normalem Full-Time-JOB als PJ (Arzt in Ausbildung sozusagen) in der Klinik (min. 10h täglich für 300€ / Monat für ein Jahr) in Anspruch nehmen würde. Von den Fehlern ganz abgesehen. Daher hoffe ich bitte, bitte auf eure Hilfe. |
![]() |
Registriert seit: 29. Nov 2010 3.072 Beiträge Delphi 2010 Enterprise |
#7
Als Ziel soll das Tool eine csv - Datei erstellen. In EXCEL Kann dies natürlich dann importiert werden. (Ist vielleicht etwas blöd beschrieben worden)
.. Grundsätzlich ..Ablauf. - Ein Tool soll nun den Dateinamen jeder Datei mit in die csv - Datei einfügen und die Daten etwas umstrukturieren. Was ich in CSV sehe (> Björk) und was Du zum Zielformat Excel (?) beschreibst, hat m.E. wenig mit Import, umstrukturieren zu tun bzw. geht "etwas" darüber hinaus. Für Dich ist das meinetwegen eine Umstrukturierung, für mich ist das bereits Analyse / Reporting und wie gesagt, nicht ohne weiteres prozedural zu implementieren respektive einfach der falsche Weg. Zum Eingangsformat: Vielleicht habe ich in all dem Durcheinander was übersehen, aber die CSV Daten beinhalten 2 Sektionen, wo ist insbesondere die Bedeutung der 2. Sektion beschrieben?
Gruß, Jo
|
![]() |
Registriert seit: 18. Apr 2015 20 Beiträge |
#8
Als Ziel soll das Tool eine csv - Datei erstellen. In EXCEL Kann dies natürlich dann importiert werden. (Ist vielleicht etwas blöd beschrieben worden)
.. Grundsätzlich ..Ablauf. - Ein Tool soll nun den Dateinamen jeder Datei mit in die csv - Datei einfügen und die Daten etwas umstrukturieren. Was ich in CSV sehe (> Björk) und was Du zum Zielformat Excel (?) beschreibst, hat m.E. wenig mit Import, umstrukturieren zu tun bzw. geht "etwas" darüber hinaus. Für Dich ist das meinetwegen eine Umstrukturierung, für mich ist das bereits Analyse / Reporting und wie gesagt, nicht ohne weiteres prozedural zu implementieren respektive einfach der falsche Weg. Zum Eingangsformat: Vielleicht habe ich in all dem Durcheinander was übersehen, aber die CSV Daten beinhalten 2 Sektionen, wo ist insbesondere die Bedeutung der 2. Sektion beschrieben? Hilf mir kurz, was meinst du mit 2. Sektion? Meinst du die 2. /3. Spalte? |
![]() |
Ansicht |
![]() |
![]() |
![]() |
ForumregelnEs ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.
BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus. Trackbacks are an
Pingbacks are an
Refbacks are aus
|
|
Nützliche Links |
Heutige Beiträge |
Sitemap |
Suchen |
Code-Library |
Wer ist online |
Alle Foren als gelesen markieren |
Gehe zu... |
LinkBack |
![]() |
![]() |