DtSearch Desktop

DtSearch ist seit 1991 eine der etabliertesten Enterprise-Suchlösungen für Windows und wird weltweit von Behörden, Anwaltskanzleien und Großunternehmen eingesetzt. Das kommerzielle Tool bietet umfangreiche Suchfunktionen inklusive Thesaurus, phonetischer Suche und mehrsprachiger Unterstützung. Eine Desktop-Lizenz kostet ab 199 US-Dollar, Developer-Lizenzen deutlich mehr. Die Software ist ausschließlich mit englischer Benutzeroberfläche verfügbar und richtet sich primär an professionelle Anwender mit hohen Anforderungen an Dokumentenrecherche.
DtSearch Desktop

Der Test: Enterprise trifft auf Pragmatismus

DtSearch startet mit spartanischer, jedoch verständlich wirkender, Oberfläche. Allerdings nur auf Englisch. Es dauert dann etwas, bis man in den Menüs die Optionen gefunden hat, mit denen der Index einzurichten ist. Für unser (wie bei allen Tests) verwendetn Ordner d:\Archiv dauerte dessen Aufbau vertretbare 15 Minuten. Danach fand dtsearch in dem bei allen Kandidaten genutzten Test genau 157 Dateien

DtSearch: 157 Treffer ohne Container-Mode

Das beste Ergebnis aller mit Parsern und Index arbeitenden Programme – aber immer noch weniger als die 172, die Findit hier findet. Dann wurden wir stutzig: Es waren bei DtSearch keinerlei Mailanhänge in den Treffern. Das müsste dieses Enterprise-Tool doch können! Und tatsächlich: In den Einstellungen fand sich etwas versteckt die Möglichkeit, unsere als .eml gespeicherten Mails als „Container" zu behandeln und auch darin eingebettete Dokumente zu durchsuchen.

Wir aktivierten diese Option und trauten zunächst unseren Augen nicht: 185 Treffer! Sogar 13 mehr als Findit!?

DtSearch – Mit Container-Mode

185 Treffer Mit Mailanhängen
15 Min. Index-Erstellung
$199+ Lizenzpreis

Des Rätsels Lösung - gar derer zwei:

⚠️ Interessante Beobachtung: False Positives

DtSearch False Positive in PDF-Metadaten Bei genauerer Betrachtung entdeckten wir: Einige der DtSearch-Treffer stammen aus technischen PDF-Metadaten – Komprimierungseinstellungen, Farbprofile und andere Strukturdaten, die für Menschen nicht lesbar sind. Das ist ein grundsätzliches Problem aller Parser-basierten Systeme: Die Grenze zwischen "echtem Inhalt" und "technischen Daten" ist nicht immer klar.

Die von Findit für PDF genutzten Parser haben dieses Problem nicht – dafür könnte es bei anderen Formaten theoretisch auch vorkommen. Keines der Systeme ist perfekt, aber die Fehlerquellen liegen an unterschiedlichen Stellen.

Zweiter Unterschied: Damit Findit nicht unnötig Rechenzeit auf Formate verschwendet, die ohnehin keinen sinnvollen Text enthalten, läuft es im Standard mit einer Liste zu durchsuchender Dateitypen. Wir haben den Filter mal ausgeschaltet und wirklich alle Dateitypen (durch)suchen lassen.

Dann dauert ein Suchlauf mit allen maximal möglichen Optionen gut 30 Sekunden... Und tatsächlich zeigt Findit nun sogar 201 Treffer.

🏆 FINDIT 6 – Alle Dateitypen

201 Treffer Alle Dateitypen
30 Sek. Suchdauer
Keine Vorbereitung
Findit 6: 201 Treffer mit allen Dateitypen

Was ist mit OCR?

Erste Vermutung: DtSearch enthält kein OCR-Modul zur Analyse gescannter Dokumente und Bilder. Allerdings stellte sich dann heraus, dass just diese bei Findit vorhandene Funktion in der gewählten Testsuche nach „Dateien" und „finden" keine Rolle spielt, weil in unserem Testarchiv kein eingescanntes Dokument mit diesen Begriffen vorhanden war. Gleichzeitig fanden wir unter den 201 Treffern von Findit eine *.exe, ein Programm, welches von dtSearch im Index naturgemäß nicht erfasst wird. Insofern: Beide arbeiten auf sehr hohem Niveau am Maximum dessen, was in Bezug auf Dateisuche Dateisuche möglich ist.

⚠️ Wichtig zu wissen:
DtSearch kann keine gescannten PDFs oder Bilder durchsuchen. Dafür benötigt man externe OCR-Software wie Adobe Acrobat, die die Dokumente vorher konvertieren muss. Findit hat OCR dagegen direkt integriert und findet Text auch in gescannten Dokumenten – ohne zusätzliche Software.

Fazit zu DtSearch

Der erste ebenbürtige Wettbewerber

DtSearch ist das erste wirklich ebenbürtige Konkurrenzprodukt. Es bietet sogar die Möglichkeit, mit einem Thesaurus Worte „ähnlicher" Bedeutung zu finden (bei gesuchtem „Haus" auch „Gebäude"). Insofern: Wirklich gute Arbeit!

Allerdings:

  • DtSearch benötigt einen doch etwas aufwendiger zu pflegenden Index
  • Findet am Ende doch nicht ganz so viel wie Findit (182 vs. 201 Treffer)
  • Ist nur mit englischer Oberfläche erhältlich
  • Kostet mindestens sechsmal mehr als Findit 6 ($199 vs. ab 33€)
  • Kein eingebautes OCR für gescannte Dokumente

Für wen ist DtSearch? Großunternehmem, die mit wirklich sehr vielen Regelmäßigen Suchabfragen von einem Index profitieren und jeden, der bereit ist, für Enterprise-Features und Thesaurus-Funktionen den deutlich höheren Preis zu zahlen.

Für wen ist Findit? Einzelanwender, kleine bis mittlere Teams und jeden, der ohne Index-Wartung, mit deutscher Oberfläche und zu einem Bruchteil des Preises mehr Treffer erzielen möchte – und das sofort, ohne Wartezeit.

Kriterium DtSearch Findit 6
Treffer 182 201
Vorbereitung 15 Min. Index Keine
Suchdauer <1 Sek. (mit Index) 30 Sek. (ohne Index)
Preis $199+ 55€
OCR Nein (extern nötig) Ja (integriert)
Oberfläche Nur Englisch Deutsch + 4 Sprachen
Thesaurus Ja Nein (Fuzzy stattdessen)
Mailanhänge Ja (nach Konfiguration) Ja (automatisch)
Archive (ZIP, RAR) Ja Ja (auch verschachtelt)
Zurück zu DocFetcher Findit 6 selbst testen Weiter zu 'Anderen'