AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Zurück Delphi-PRAXiS Sprachen und Entwicklungsumgebungen Sonstige Fragen zu Delphi Delphi schnelle Algorithmen für Textanalyse gesucht
Thema durchsuchen
Ansicht
Themen-Optionen

schnelle Algorithmen für Textanalyse gesucht

Ein Thema von Panthrax · begonnen am 29. Jul 2005 · letzter Beitrag vom 29. Jul 2005
Antwort Antwort
Panthrax

Registriert seit: 18. Feb 2005
286 Beiträge
 
Delphi 2010 Enterprise
 
#1

schnelle Algorithmen für Textanalyse gesucht

  Alt 29. Jul 2005, 00:18
Hallo.

Ich möchte Text analysieren. Typische Fragen dabei sind:
  • Wie häufig ist jedes Wort?
  • Wie häufig ist jede Wortgruppe?
  • Wie nah sind sich Wörter und Wortgruppen mit anderen Wörtern und Wortgruppen? Soll heißen: Wort(gruppe) A und Wort(gruppe) B stehen 0, 1, 2, 3,... Worte auseinander.
  • Sind Worte/Wortgruppen zitiert? Welche, wie häufig?
  • Wie kann ich die Formatierung der Worte als Gewichtung einfließen lassen?
  • ...
Wer kennt Projekte, bei denen man sich ähnliche Funktionen ansehen kann? Gibt es Delphi-Komponenten oder -Funktionen, die sich mit sowas beschäftigen? Gibt es schon Routinen in dieser Richtung?

Ich habe schon in etlichen Suchmaschienen gesucht und so... Aber entweder mir fehlen die richtigen Suchbegriffe oder keine Ahnung...

Gruß
Panthrax
  Mit Zitat antworten Zitat
marabu

Registriert seit: 6. Apr 2005
10.109 Beiträge
 
#2

Re: schnelle Algorithmen für Textanalyse gesucht

  Alt 29. Jul 2005, 05:42
Hallo Panthrax,

der elementare Ansatz bei der Textanalyse ist die Trennung von zwei Funktionalitäten: der harvester / analyzer zerlegt die Texte in Wörter (und Sätze, Abschnitte, je nach Anspruch) und hält deren Dokumentzugehörigkeit in einer Datenbank fest. Der query processor liefert dann die gewünschte Information.

Der Parser scheint mir nicht sehr aufwendig zu sein. Problematischer ist die Implementierung eines performanten Speichers, der auch mit großen Textmengen (Kompression) zurecht kommt.

Es gibt eine Reihe von OpenSource Projekten, die sich mit full text retrieval befassen:
ht://dig, Harvest, Harvest-NG, SWISH-E.

Hier findest du eine Linksammlung.

Und für Delphi-Entwickler ist vielleicht Rubicon interessant.

Grüße vom marabu
  Mit Zitat antworten Zitat
Panthrax

Registriert seit: 18. Feb 2005
286 Beiträge
 
Delphi 2010 Enterprise
 
#3

Re: schnelle Algorithmen für Textanalyse gesucht

  Alt 29. Jul 2005, 11:54
Ich habe mir schon einige Sachen mal angesehen. Nicht schlecht. Danke.

Bin aber auch gern noch für weitere Implementierungen zu haben.

Panthrax
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 01:56 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz