AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Object-Pascal / Delphi-Language Delphi Link aus Quelltext raussuchen und auflisten
Thema durchsuchen
Ansicht
Themen-Optionen

Link aus Quelltext raussuchen und auflisten

Ein Thema von knolli · begonnen am 8. Jan 2008 · letzter Beitrag vom 16. Jan 2008
Antwort Antwort
Seite 1 von 3  1 23      
Benutzerbild von knolli
knolli

Registriert seit: 22. Sep 2006
Ort: Zittau
83 Beiträge
 
Delphi 7 Enterprise
 
#1

Link aus Quelltext raussuchen und auflisten

  Alt 8. Jan 2008, 18:52
Hallöchen!

ich habe folgendes Problem... Ich möchte ein Programm schreiben, welches mir eine Wortsammlung von Internetseiten zusammstellt.
Dazu hole ich mir den Quelltext einer von mir eingegebenen Startseite und suchen diesen nach Wörtern ab. Damit meine Wortsammlung schön groß wird, möchte ich die im Quelltext gefundenen Links auflisten und nacheinander nach dem gleichen Schema abarbeiten. Wenn das funktioniert, dann müsste das ganze ja unendlich lange gehen nzw bis die Festplatte voll ist(oder halt die DB).
Deswegen möchte ich auch diese PROCEDURE jederzeit unterbrechen können.
mein Problem liegt jetzt darin, dass ich zwar mit POS und COPY den Link lokalisieren und copieren kann, aber keine Länge für COPY angeben kann, da ich ja die Länge des Links nicht kenne. Wie kann man das am besten bewerkstelligen?

was ich bis jetz habe, ist das:

Delphi-Quellcode:
RichEdit_Quellcode.Lines.Add(iDHTTP1.Get('http://'+Editinet.Text)); //<== Protkoll angeben!!!
For i:=1 to RichEdit_Quellcode.Lines.Count do begin
Memo_Links.Lines.Add(Copy(RichEdit_Quellcode.Lines[i],POS('<a href="',RichEdit_Quellcode.Lines[i]),???)));
wo die ??? stehen hörts bei mir auf...
Ich hoffe das mir jemand helfen kann!

mfg
knolli
  Mit Zitat antworten Zitat
8. Jan 2008, 18:58
Dieses Thema wurde von "SirThornberry" von "Neuen Beitrag zur Code-Library hinzufügen" nach "Object-Pascal / Delphi-Language" verschoben.
Benutzerbild von SirThornberry
SirThornberry
(Moderator)

Registriert seit: 23. Sep 2003
Ort: Bockwen
12.235 Beiträge
 
Delphi 2006 Professional
 
#3

Re: Link aus Quelltext raussuchen und auflisten

  Alt 8. Jan 2008, 18:59
ein Link wird durch "</a>" abgeschlossen. Wenn du also mit PosEx danach suchst (beginnend ab dem Anfang des Links) so kannst du die Länge errechnen.
Jens
Mit Source ist es wie mit Kunst - Hauptsache der Künstler versteht's
  Mit Zitat antworten Zitat
Benutzerbild von knolli
knolli

Registriert seit: 22. Sep 2006
Ort: Zittau
83 Beiträge
 
Delphi 7 Enterprise
 
#4

Re: Link aus Quelltext raussuchen und auflisten

  Alt 8. Jan 2008, 19:04
wie soll der befehl dann aussehen?

Memo_Links.Lines.Add(Copy(RichEdit_Quellcode.Lines[i],POS('<a href="',RichEdit_Quellcode.Lines[i]),PosEx('</a>',RichEdit_Quellcode.Lines[i])))); oder wie sorry von PosEx höre ich heute zum ersten mal..
  Mit Zitat antworten Zitat
mashutu

Registriert seit: 15. Nov 2007
195 Beiträge
 
#5

Re: Link aus Quelltext raussuchen und auflisten

  Alt 9. Jan 2008, 08:30
Zitat von knolli:
wie soll der befehl dann aussehen?

Memo_Links.Lines.Add(Copy(RichEdit_Quellcode.Lines[i],POS('<a href="',RichEdit_Quellcode.Lines[i]),PosEx('</a>',RichEdit_Quellcode.Lines[i])))); oder wie sorry von PosEx höre ich heute zum ersten mal..
Fuer PosEx gibbet hier irgendwo im Forum Code. Aber man kann es auch mit Bordmitteln machen.

Uebersichtlicher waere es vielleicht so (kurz und knackig, aber vielleicht nicht fuer alle Zwecke in dieser Form sinnvoll):
[code=delphi]
s:=RichEdit_Quellcode.Lines[i];
i:=pos('foobar
enthalten. Daher sollte das erste Vorkommen von chr(34) NACH dem Anker das Ende des URI sein.
utu

if it was hard to write it should be hard to read
  Mit Zitat antworten Zitat
s-off
(Gast)

n/a Beiträge
 
#6

Re: Link aus Quelltext raussuchen und auflisten

  Alt 9. Jan 2008, 08:52
Zitat von mashutu:
Fuer PosEx gibbet hier irgendwo im Forum Code. Aber man kann es auch mit Bordmitteln machen.
PosEx ist ein Bordmittel!
Einfach mal in der Hilfe nachschlagen - dafür ist Sie da...

Dennoch würde ich vielleicht zu dem Beispiel von Marabu greifen

Edit: Rechtschreibfehler korrigiert
  Mit Zitat antworten Zitat
mashutu

Registriert seit: 15. Nov 2007
195 Beiträge
 
#7

Re: Link aus Quelltext raussuchen und auflisten

  Alt 9. Jan 2008, 09:08
Zitat von s-off:
PosEx ist ein Bordmittel!
Stimmt, sorry. Hab PosEx eingegeben und der Compiler kannte es nicht weil StrUtils nicht in der uses-anweisung stand.
Da ich vor zwanzig Jahren meine eigenen Routinen dieser Art geschrieben habe - als es die noch nicht so gab, bin ich nicht imnmer auf der Hoehe der Zeit, was mittlerweile alles mitgeliefert wird. Da ich meine eigenen Bibliotheken einsetze.

[EDIT: mit posex finde ich es jedenfalls unuebersichtlicher:
Memo_Links.Lines.Add(Copy(RichEdit_Quellcode.Lines[i],POS('<a href="',RichEdit_Quellcode.Lines[i]),PosEx('"',RichEdit_Quellcode.Lines[i],POS('<a href="',RichEdit_Quellcode.Lines[i])))));
utu

if it was hard to write it should be hard to read
  Mit Zitat antworten Zitat
s-off
(Gast)

n/a Beiträge
 
#8

Re: Link aus Quelltext raussuchen und auflisten

  Alt 9. Jan 2008, 09:09
Zitat von mashutu:
Stimmt, sorry.
Sollte kein Vorwurf sein
  Mit Zitat antworten Zitat
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#9

Re: Link aus Quelltext raussuchen und auflisten

  Alt 9. Jan 2008, 09:09
Hallo,

natürlich lässt sich jeder Text als einfache Folge von Zeichen betrachten und mittels PosEx() und Copy() untersuchen. Berücksichtigt man die besondere Semantik (HTML), dann hilft vielleicht Hier im Forum suchenExtractLinks() weiter.

Freundliche Grüße
  Mit Zitat antworten Zitat
mashutu

Registriert seit: 15. Nov 2007
195 Beiträge
 
#10

Re: Link aus Quelltext raussuchen und auflisten

  Alt 9. Jan 2008, 09:12
Zitat von s-off:
Zitat von mashutu:
Stimmt, sorry.
Sollte kein Vorwurf sein
Neee, is schon in Ordnung. Bin immer froh, wenn ich mal ein paar alte Assemblerfunktionen aus meinem Code schmiessen kann und was dazulerne...
utu

if it was hard to write it should be hard to read
  Mit Zitat antworten Zitat
Antwort Antwort
Seite 1 von 3  1 23      


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 08:27 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz