Ihre Sprache:




SoftCrawler Metasuchmaschine

Non-Profit Projekt, Studienarbeit / Semester-Arbeit

Keywords: Suchmaschine, Information Retrieval, intelligente Agenten, Fuzzy Matching, Suffix Bäume, reguläre Ausdrücke, objekt-orientiertes programmieren

Softcrawler ist eine Metasuchmaschine für Soft- Free- und Shareware.

In der aktuellen Version werden bis zu 10 bekannte Software Archive abgefragt. Die verschiedenen Anfragen werden parallel and die Download Anbieter abgesendet, gefiltert und anschließend sortiert in einer einheitlichen Liste dargestellt.

Es können Namen von Software-Paketen oder ganz allgemeine Suchbegriffe eingegeben werden. Es wird außerdem die erweiterte Suchsyntax (+/-) bereitgestellt, um gezieltere Anfragen zu stellen.
Die resultierenden Suchergebnisse können im Anschluss nochmals nach Software Lizenz, Plattform oder Anbieter gefiltert und bei Bedarf nach Titel oder Relevanz des Treffers umsortiert werden.

Im November 1998 erhielt Softcrawler den BotSpot Award (www.botspot.com)

http://www.softcrawler.de



XploreThe.net Metasuchmaschine

Non-Profit Projekt, Studientarbeit / Forschungsarbeit

Keywords: Suchmaschine, Information Retrieval, Suffix Tree Algorithmus (STC), Fuzzy Matching, Information Clustering, object-orientiertes programmieren, C, C++, Java

Bei dieser Metasuche handelt es sich um eine allgemeine Suche für Webdokumente. Dazu werden 5 große Suchmaschinen befragt, die Ergebnisse gesammelt und anschließend nach verschiedenen Methoden dargestellt. Neben der herkömmlichen Ergebnisliste können verschiedene Algorithmen angewendet werden, so zum Beispiel Fuzzy Matching (eine unscharfe Suche im Zusammenhang des Suchwortes). Eine andere Variante ist der Suffix Tree Clustering Algorithmus (STC), der die Ergebnisse in Informationsgruppen (Cluster) mit Gemeinsamkeiten anordnet. Gleichzeitig bewertet STC auch die Relevanz dieser Cluster. Als dritte Clustering Methode können alle Treffer nach Toplevel-Domain (TLD) gruppiert werden.

Diese Metasuche befindet sich in der Entwicklung und wird stetig weiter ausgebaut und verbessert. Die komplette Anwendung ist in C/C++ programmiert und ist in der Ausführung sehr schnell. Natürlich hängt die Schnelligkeit auch von der Internet-Auslastung ab.

Dieses Projekt ist in Vorbereitung und wird bald zur Verfügung stehen