Suchen oder nicht suchen?

Johannes Stiehler
Technologie
#Suche
Cover Image for Suchen oder nicht suchen?

Strümpfe und Stichwörter

Suche ist außerordentlich präsent in unserem analogen wie in unserem digitalen Leben. Zumindest, was das analoge Leben betrifft, reden wir nicht gerne darüber. Wenn ich etwas suchen muss, dann habe ich entweder vergessen, wo es ist – also ist mein Gedächtnis schwach – oder ich habe es gar nicht erst an einen durchdachten Platz gelegt – also ist mein Ordnungssinn unterentwickelt.

Erst wenn eine bestimmte Menge an Informationen verwaltet werden muss, ist “Suchen” akzeptabel, z.B. in einer Bibliothek. Natürlich suchen wir hier nicht in einem ungeordneten Haufen Bücher. Meistens stehen sie vorsortiert – erst nach Kategorie, dann alphabetisch nach Autor. Aber was, wenn ich mich nur an den Namen der Hauptfigur erinnere? Oder wenn ich eine rare Unterkategorie suche (“Daguerreotypie” im Fotografie-Segment). Spätestens jetzt kann ich das Problem nicht mehr durch Anordnung lösen. Weder will man beliebig kleine Unterkategorien-Regale haben noch will man Bücher zwei oder dreimal kaufen, damit sie in verschiedenen überlappenden Bereichen stehen können. Bibliotheken hatten hier früher einen Schlagwortkatalog: Einen Schrank voller Karteikarten mit jeweils einem Wort (“Daguerreotypie”) oder einer Phrase (“Kategorischer Imperativ”), die Hinweise auf alle Bücher enthielt, die damit in Verbindung stehen.

Digitaler Distress

Im digitalen Bereich hat man es eigentlich fast immer mit einer so großen Menge an Informationen zu tun, dass Kategorien und ein einzelnes Ordnungsverfahren (alphabetisch) nicht aussreichen, um sinnvoll auf Bereiche zuzugreifen. Selbst ein normaler Online-Shop hat schon so viele Artikel, dass ich ein halbes Dutzend Filter auswählen muss (Größe, Farbe, Typ, Schnitt), um zu etwas zu gelangen, das mir – manchmal – gefällt. Auf der anderen Seite sind im digitalen Leben Dinge möglich, die analog sehr schwierig sind: Zum Beispiel mehrere verschiedene Kategorienbäume auf den gleichen Datenbestand anwenden: Ich kann Bücher literaturhistorisch gruppieren (Romantik → Spätromantik, Mittelalter → Frühmittelalter) oder geographisch (Lateinamerika → Brasilien, Asien → Mongolei) oder nach Gattung (Roman → Kriminalroman → Heimatkriminalroman → Heimatkriminalroman in schwäbischem Dialekt). Das ließe sich beliebig verfeinern und erweitern: Im analogen Bereich unmöglich lösbar, im digitalen Bereiche mittlerweile relativ selbstverständlich.

Fantastischer Volltext

Und wie großartig wäre es doch, wenn man einen Schlagwortkatalog hätte, der einfach alle Wörter aus allen Büchern erfasst? Voilà, schon sind wir bei der Volltextsuche. Diese macht nichts anderes als eine abfragbare Liste aller Wörter zu erstellen, die jeweils Zeiger auf die “Bücher” haben, die sie enthalten.

Suche ist überall, Suche ist immer nötig, aber Suche ist natürlich nie Selbstzweck. Im Gegenteil, idealerweise sollte man gar nicht wirklich bemerken, dass man sucht. Je weniger Mühe die Suche macht, desto erfolgreicher normalerweise das Angebot, je weniger ein Nutzer in die Suche eingeben muss, um zum Ziel zu kommen, umso besser. Das war schon immer so und kulminiert in einem Ansatz, den wir früher “Zero Term Search” genannt haben, d.h. einer Suche, die nur durch das ausgelöst wird, was wir über den Nutzer wissen und nicht durch das, was er eintippt.

Kundegetrieben vs. Massenware

In den frühen 2000er Jahren war das Thema “Suchmaschine” so dominant, dass viele unserer Kunden damals eigene und ausgefeilte Ideen hatten, welche Probleme sie mit dieser Maschine lösen können. Oder aber man hat sich eine teure Suchplattform geleistet, weil alle anderen auch eine hatten. Viele dieser Suchlösungen waren ungemein spannend und gut gedacht, aber zu fortgeschritten für ihre Zeit, andere waren einfach schrecklich, weil völlig unüberlegt und am Nutzer vorbei. Und manche waren durchdacht und trafen den Kern des Nutzerproblems. Das waren die Fälle, in denen gekonnter Einsatz einer off-the-shelf-Software zu echten Geschäftserfolgen geführt hat.

Mittlerweile ist Suche eine Commodity, die in andere Applikationen eingebaut ist, ein Feature, das man erwartet. Das hat den Vorteil, dass man meistens seinen Kram findet. Der Nachteil ist, dass über Suche als “Ermöglicher” von komplexen Anwendungen nicht mehr viel nachgedacht wird. Oft wird eine unoptimierte Volltextsuche auf eine Webseite gestülpt und das ist dann das “Serviceangebot”. Oder die Suche im Standard-Shop muss den Kunden halt ausreichen, um die richtigen Produkte zu finden. Wenn die Produkte dann z.B. “???” (Die drei Fragezeichen) heißen oder völlig unklar ist, wie man Bulgakov / Bulgakoff / Bulgakow im Deutschen transliteriert, dann ist das halt Pech und man muss halt was von Müller oder Meier mit einem normalen Titel lesen.

Suche ist unverzichtbar

Aus unserer Sicht sind Suchfunktionen essentiell für den Erfolg einer riesigen Bandbreite von Software. Sie darf – auch heute – kein stiefmütterlich behandelter Nebenaspekt sein. Sie darf nicht einfach standardisiert sein, weil die Anwendungsfälle der Nutzer auch nicht so allgemein standardisiert sind. Ich habe hier ein Buch liegen namens “Search Patterns”. Dieses Buch ist von 2010 und skizziert unter anderem das “Dreigestirn” Autovervollständigung, Suche, Filtern – ein seit langem etablierter Weg, mit dem ein Nutzer schnell zu seinem Wunschergebnis kommt. Dieses Buch ist nun 11 Jahre alt und immer noch haben viele Angebote im Web einfach nur das Antipattern “Suchbox → schlechtes Ergebnis” ausgerollt. Dann muss es nicht weiter verwundern, dass Leute zu Google gehen, um Informationen auf meiner Webseite zu finden.

Ja, genau, warum lassen wir eigentlich nicht alle zu Google gehen? Ist das nicht die preiswerteste (weil kostenlose) Lösung, um etwas zu finden? Das stimmt oft, z.B. für reine Informationsportale, aber damit gibt der Informationseigner die Sucherfahrung vollständig aus der Hand. Warum verwendet man Stunden darauf, Menüstrukturen zu optimieren, auf die eh niemand klickt und das wesentliche Werkzeug, mit dem Nutzer mit meiner Seite interagieren, händigt man einem Dritten aus?

Man merkt es schon: Wir sind nicht fertig mit dem Thema Suche. Während die notwendige Software immer mehr Commodity wird - entweder als immer beigepackte Zutat oder via Open Source, ist die Konfiguration, Optimierung und Verwendung von Suche zur Beglückung von Nutzern nach wie vor eine echte Herausforderung, die Aufwand verursacht, aber auch hohe Erträge verspricht.

In der Vergangenheit haben wir vor allem an Typen von Anwendungsfällen gearbeitet, die nicht durch Google gelöst werden können. Google ist größtenteils agnostisch gegenüber dem Anwendungsfall. Das ist gleichzeitig seine Stärke und seine Schwäche. Dadurch kann es sich beliebig Inhalte aneignen und verwerten, die andere im Schweiße ihres Angesichts erstellt haben und Milliarden daran verdienen. Aber andererseits kann es kaum auf Spezifika der Inhalte und der Nutzerinteressen eingehen, weil es dann eben nicht mehr “allgemeingültig” wäre.

Wer also sehr spezifische Inhalte hat (z.B. wissenschaftliche Artikel oder Fahrradersatzteile) und wer sehr viel über die Absichten und Bedürfnisse seiner Nutzer weiß, wird nach wie vor von suchbasierten Lösungen profitieren. Wir helfen gern dabei.

Johannes Stiehler
CO-Founder NEOMO GmbH
Johannes hat während seiner gesamten Laufbahn an Softwarelösungen gearbeitet, die Textinformationen verarbeiten, anreichern und kontextabhängig anzeigen.

Wir haben noch mehr zu bieten!

Unseren Newsletter abonnieren

Wenn Sie sich vom Twitter- und LinkedIn-Wahnsinn abkoppeln, aber trotzdem unsere Inhalte lesen möchten, freuen wir uns und haben genau das richtige für Sie: Unser Newsletter hält Sie über alles Wissenswerte auf dem Laufenden.

Bitte benutzen Sie das untenstehende Formular, um ihn zu abonnieren.

NEOMO GmbH ("NEOMO") verpflichtet sich, Ihre Privatsphäre zu schützen und zu respektieren, und wir werden Ihre persönlichen Daten nur dazu verwenden, Ihr Konto zu verwalten und die von Ihnen angeforderten Produkte und Dienstleistungen bereitzustellen.

Um Ihnen die gewünschten Inhalte zur Verfügung stellen zu können, müssen wir Ihre personenbezogenen Daten speichern und verarbeiten. Wenn Sie damit einverstanden sind, dass wir Ihre personenbezogenen Daten zu diesem Zweck speichern, markieren Sie bitte das unten stehende Kästchen.

Sie können sich jederzeit von diesen Mitteilungen abmelden. Weitere Informationen darüber, wie Sie sich abmelden können, über unsere Datenschutzpraktiken und darüber, wie wir Ihre Daten schützen und respektieren, finden Sie in unserer Datenschutzrichtlinie.

Folgen Sie uns für Einblicke, Ausblicke und Durchblicke.

Wann immer neue Inhalte verfügbar sind oder etwas Bemerkenswertes in der Branche passiert - wir halten Sie auf dem Laufenden.

Folgen Sie uns auf LinkedIn und Twitter, um Neuigkeiten zu erfahren, und auf YouTube für bewegte Bilder.

Teilen, wenn's gefällt

Wenn Ihnen unser Beitrag gefällt, helfen Sie uns bitte, ihn zu verteilen, indem Sie Ihr eigenes Netzwerk aktivieren.

Weitere Blogartikel

Image

ChatGPT „weiß“ gar nichts

Sprachmodelle tun sich notorisch schwer damit, Fakten verlässlich abzurufen. Leider antworten sie aber auch fast nie mit „Ich weiß nicht“. Die Last, zwischen Halluzination und Wahrheit zu unterscheiden, liegt also vollständig auf dem Anwender. Das bedeutet effektiv, dass dieser Anwender die Informationen aus dem Sprachmodell überprüfen muss – indem er den Fakt, den er sucht, gleichzeitig aus einer anderen, verlässlichen Quelle bezieht. Als Wissensspeicher sind LLMs also mehr als nutzlos.

Image

Rundify - lesen, verstehen, testen

Digitale Technologie hat die Menschen mit Informationen überladen, aber Technologie kann ihnen auch helfen, aus dieser Flut eine Wissensquelle zu machen. Large Language Models können – richtig eingesetzt – ein Baustein hierzu sein. Unser Tool "rundify" zeigt, wie so etwas aussehen könnte.

Image

ChatGPT und der Ölteppich

Wie schon beim Deep Learning bleiben Daten auch bei großen Sprachmodellen wichtig. Da das Basismodell jedoch von jemand anderem trainiert wurde, ist es in diesem Fall unmöglich zu sagen, welche Daten wirklich enthalten sind. Da das Fehlen von Daten zu Halluzinationen führt, hat diese Unwissenheit ziemlich schwerwiegende Folgen.