Sie sind hier: Home » Literatur » White Papers

Juristisch relevante Dokumente aufspüren

Finden juristische Suchwerkzeuge beim eDiscovery mehr als Google und Co.?
Internet-Suchmaschinen zielen nicht darauf, alle relevanten Dokumente zu finden

(05.05.09) - Viele Unternehmen sind der Ansicht, dass sie mit einer Internet-Suchmaschine ausreichenden Zugriff auf geschäftskritischen Informationen haben. Dass dies immer davon abhängt, was und wofür gesucht wird, will jetzt Zylab in ihrem neuen Whitepaper "Understanding the Difference between Legal Search and Web Search: What You Should Know About Search Tools You Use for e-Discovery" aufzeigen. Der innovative Entwickler von Lösungen für den Datenzugriff stellt darin die grundlegenden Unterschiede dar zwischen gängigen Internet-Suchmaschinen und juristischen Suchwerkzeugen, die die strategischen Anforderungen im Rahmen rechtlicher Aktivitäten unterstützen.

Zu den größten Unterschieden gehört, dass typische Internet-Suchmaschinen darauf abzielen, die relevantesten Dokumente zu finden. Sie sind nicht dafür vorgesehen, alle relevanten Dokumente zu finden. Genau das ist aber die Aufgabe aller Recherchierenden im juristischen Umfeld: sie müssen alle potenziell relevanten Dokumente finden.

Darüber hinaus benötigen sie verschiedene Funktionalitäten, um schnell und effizient relevante Dokumentsätze zu durchsuchen und einzusehen. Diese beiden Anforderungen umreißen bereits den erheblichen Unterschied zwischen gängigen Internet-Suchmaschinen und jenen Werkzeugen, die speziell für Discovery-ähnliche Aktivitäten im juristischen Umfeld konzipiert sind.

Nicht jede Suchmaschine erfüllt die speziellen Anforderungen
Das neue Whitepaper von Zylab veranschaulicht die besonderen Anforderungen beim sogenannten "Legal Search", der Suche nach relevanten Dokumenten im juristischen Umfeld. Diese werden verglichen mit den Fähigkeiten gängiger Internetsuchmaschinen.

Dabei gibt es unterschiedliche Aspekte zu bedenken:
Erfahrene Internetnutzer sind inzwischen sehr kreativ, ihr Ranking durch Suchoptimierungstechniken zu verbessern. Das funktioniert aber in beide Richtungen: Wer kriminelle Aktivitäten zu verbergen hat – z.B. Betrug – möchte nicht unter den Top Ten einer Trefferliste erscheinen. Deshalb nutzt er die gleichen Kenntnisse in umgekehrter Richtung und versteckt seine verräterischen Aktivitäten, um auf keiner Trefferliste zu erscheinen.

In vielen Fällen nutzen Organisationen die Technologie von Google und Co, anstatt für E-Discovery geeignete Tools zu verwenden, wenn sie per Volltextsuche große E-Mail- oder Dateisammlungen in Unternehmensnetzwerken durchforsten. Sie stoßen dabei jedoch bald an die Grenzen der Internet-Suchtechnologien, die ihnen keine Unterstützung bei der Einhaltung von Fristen und der Erfüllung der Anforderungen seitens der Regulierungsbehörden und Gerichte bieten. Das kann in höheren Kosten und möglichen Geldstrafen resultieren. Leider werden diese Grenzen oft erst entdeckt, wenn es bereits zu spät ist.

Typische Sucheingaben umfassen Hunderte von Wörtern. Um hierbei auch Abweichungen in der Schreibweise zu erfassen (z.B. bei Tipp- oder Erfassungsfehlern) müssen gute Werkzeuge auch die Nutzung von Wildcards (Platzhalter für Anfang, Mitte oder Ende von Wörtern) erlauben und die Fuzzy-Suche unterstützen. Internet-Suchtechnologien sind dazu entweder nicht in der Lage oder viel zu langsam.

Darüber hinaus müssen Suchmaschinen stets exakt die gleichen Ergebnisse liefern, wenn sie dieselbe Datensammlung durchsuchen. Internet-Suchmaschinen oder solche, die auf Technologien für statistische Relevanzlisten im großvolumigen Bereich basieren, neigen dazu, jedes mal unterschiedliche Ergebnisse zu produzieren. Oft können Internet-Suchmaschinen auch nur die 20.000 relevantesten Dateien in ihrem Index für einen einzelnen Fall bewahren. Diese sind komplett nutzlos in einem juristischen Kontext. Weiterhin können viele der Internet-Suchmaschinen Dokumente, die aus Compound-Dokumenten (z.B. ZIP und PST) bestehen, sowie Bitmap-Daten, Multimedia-Dokumente, ältere Datei-Formate und verschlüsselte Dateien nicht indizieren.

Regulierungsbehörden, Gerichte sowie Anwälte der Gegenpartei haben häufig sehr spezifische Formatanforderungen für die offenzulegenden Daten. Anwender sollten gängige juristische Dateiformate wie DII, EDRM XML, iPro oder Concordance Load-Files unterstützen können. Sie sollten die Möglichkeit haben, Dokumente zu bearbeiten, wodurch es notwendig wird, native elektronische Dateien als TIFF zu drucken. Dann können sie verifizieren, dass irrelevante Informationen nicht länger im offengelegten Dokument enthalten sind. Darüber hinaus müssen gefundene Daten gesammelt und auf einen Legal-Hold-Server kopiert werden, was mit Internet-Suchmaschinen fast unmöglich ist.

"Wer die im Whitepaper angesprochenen Punkte nicht adressiert, muss mit teuren und ineffizienten Abläufen beim E-Discovery rechnen", weiß Prof. Dr. Johannes Scholtes, President, Zylab North America LLC. "Jede Unregelmäßigkeit, verpasste Frist oder fehlende Datei bedeutet eine mögliche Geldstrafe und eine noch größere Abhängigkeit von teuren, externen Anbietern. Dagegen lassen sich Risiken durch das Verständnis erforderlicher Abläufe und durch die Anpassung der Prozesse an diese Abläufe mittels geeigneter Werkzeuge vermindern. Auch die Zusammenarbeit mit passenden Partnern trägt dazu bei, Gefahrenpotenzial und Kosten zu minimieren." (Zylab: ra)



Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen