FINDIT: die ultimative Dateisuchmaschine mit 'Vorliebe' für komplexe Volltextsuche!
Findet Dateien auf dem PC, schneller, einfacher als je zuvor!
Werbebanner Findit

Index ? oder nicht Index ?

Als FINDIT erstmals im Jahr 1994 erschien, gab es kaum andere Programme mit Ähnlichen FÄhigkeiten. SpÄter erschienen zunehmend Programme zur 'indizierten' Volltextsuche. Sie können Dokumente mit Hilfe einer Datenbank innerhalb von Sekunden finden. Ein Programm wie FINDIT könnte dadurch theoretisch obsolet werden. Doch im Gegenteil: die Nachfrage ist in den letzten Jahren sogar deutlich spürbar gestiegen. Woran könne das liegen?

Wenn man annähernd weiss, wo das Dokument liegt und nur gezielt einige hundert MB durchsucht, braucht FINDIT - obwohl es ohne vorher angelegten Index arbeitet - nur wenige Sekunden. Teilweise ist FINDIT dabei sogar schneller als Index-basierende Suchprogramme. Selbst Gigabyte-große Datenbestände durchsucht FINDIT in wenigen Minuten. Sucht man z.B. gezielt entsprechende Dateien 'aus dem letzten Quartal', schrumpft die zu bearbeitende Datenmenge - ebenso, wenn man auf einer hunderte Gigabyte großen Festplatte gezielt nur 'Textdateien' finden will und sÄmtliche Multimedia- Bild oder Systemdateien ignorieren kann. Selbst viele GB können auch so ohne Index schon nach Sekunden oder zumindest Minuten fertig durchsucht sein.

FINDIT durchsucht bei Bedarf sogar Dateien, die in einem Zip-Archiv verpackt als Mailanhang abgespeichert wurden.... von einem Index würden die gar nicht erfasst - und mit indexbasierter Suche ungefunden bleiben.

Natürlich kann ein Index Suchläufe in sehr großen Datenbeständen beschleunigen. Doch solch ein Index, in dem jedes Dokument mit allen darin vorkommenden Worten erfasst ist, muss erstellt werden (das kann tatsächlich Tage dauern), muss ständig aktualisiert werden (das kostet Ressourcen) und hat rund 20 Prozent des Volumens der Originaldaten. (Das können selbst schnell Gigabyte werden) Für Privatnutzer an einem einzelnen Home-PC mag das akzeptabel sein. Extrem aufwendig wird Indizierung aber in Netzwerken, wo eventuell auf verschiedenen Rechner gesucht werden soll und ein Neztwerkübergreifender Index erheblichen Aufwand erfordert und Ressourcen kostet. Gleichzeitig umfasst ein Index nur ausgewählte Dateitypen, eine falsch gespeicherte Datei wird unauffindbar. FINDIT dagegen kann ohne administrativen Aufwand, ohne Vorbereitungszeit, überall annähernd jeden Dateityp (durch)suchen.

Beispiele zur Suchgeschwindigkeit: Gestestet auf einem heutzutage eher langsamen Bürosystem (AMD Phenom 3000 Mhz) mit insgesamt 140.000 Dateien einer Gesamtgröße von gut 300 GB . Darin enthalten: ein Textarchiv (alle Formate gemischt). Es enthält rund 22.000 Dateien aus 15 Jahren und umfasst allein 5 GB, weitere 4 GB an Text- enthaltenden Dokumenten liegen auf die übrigen Ordner verstreut. Das ist schon ein recht umfangreiches Archiv.

Beispiel 1: Durchsucht werden das Archiv und die im aktuellen Betrieb üblicherweise verwendeten Ordner und zwar nach allen Dokumenten, die im letzten Quartal erstellt wurden, und sich mit dem 'Auto' oder 'KFZ' und 'Abgas' beschäftigen sollen. Nach 4 Sekunden bekomme ich erste Treffer, nach 1 Minuten und 24 Sekunden sind insgesamt 23 Treffer gefunden und die Suche abgeschlossen. Unter den gefundenen Dokumenten fanden sich übrigens selbst pdf-Dateien, die als Mailanhang in eine weitere mail verpackt weitergeleitet und abgespeichert wurden

Beispiel 2: Nun will ich aber auch Irrläufer finden, durchsuche also alle vorhandenen Verzeichnisse auf allen Platten, selbst versteckte Ordner wie den Papierkorb. Wieder bekomme ich erste Ergebnisse, die ich mir anschauen kann, nach 4 Sekunden. Die Liste füllt sich, bis nach 2 Minuten 40 Sekunden klar ist: auf der Platte befinden sich insgesamt 64 Dokumente mit diesen Begriffen und aus dem gesuchten Zeitraum. Eine davon wurden im Papierkorb gefunden

Beispiel 3: Auf den Platten befinden sich Dokumente aus zehn Jahren. Wenn nur nach dem letzten Quartal gesucht wird, können viele Dateien natürlich übersprungen werden. Wenn Sie wirklich alle jemals erstellten Dokumente auf solch einem Rechner durchsuchen wollen dauert es dann doch noch etwas länger Auf unserem Testrechner würden zwar zwei Drittel der vorhandenen Dateien ignoriert, weil sie 'Multimedia-' oder 'Bild-'Dateien sind, trotzdem. geht es nun doch um rund 9 GB effektiv zu durchsuchender Text-Dokumente: Wenn man sich dabei halbwegs sicher sein kann, daß man sich das Entpacken von zips und das durchsuchen von Mailanhängen sparen kannt dauert selbst das nur 4 Minuten und 12 Sekunden. Gefunden werden nun 198 Dateien.

Deutlich länger dauert die Suche allerdings, wenn man alle vorhandenen Zips und Mail-Anhänge sicherheitshalber mit-durchsuchen will und wirklich ohne jegliche zeitliche Limitierung die gesamten 302 Gigabyte durchforstet. Dann reicht die Zeit doch zum Erledigen einer anderen Aufgabe oder auch eine Mittagspause, Minuten. Man merkt dabei. Eine Einschränkung des Suchzeitraumes und anderer Kriterien kann den Suchlauf dramatisch beschleunigen. Wenn Sie nun meinen, solche Einschränkungen zur Beschleunigung würden die 'freien Suchmöglichkeiten' doch zu sehr einschränken, gilt andersherum aber auch: Wenn man wirklich 'frei' sucht erhält man oft auch viel zu viele Treffer, die man dann zeitaufwendig selbst nach den wirklich gesuchten Dokumenten durchforsten muss.

Zum Download