Hybrid Search & Retrieval

Eine Suche, die Ergebnisse liefert, ist nicht dasselbe wie eine Suche, die findet. In der Lücke dazwischen verlieren Kataloge leise Umsatz — und sie ist messbar, also reparierbar.

Wann Sie mich anrufen

Die Suche "funktioniert" — keine Fehler, Ergebnisse kommen — aber Kunden tippen ein Produkt ein und finden Artikel nicht, die Sie tatsächlich auf Lager haben.
Sie wählen oder tunen eine Vektordatenbank, und die öffentlichen Benchmarks sehen Ihren Daten kein bisschen ähnlich.
Ihr Katalog ist mehrsprachig — Türkisch inklusive — und Tokenisierung oder Embedding-Verhalten bricht auf Arten, die in keiner Doku stehen.
Sie wollen Bildsuche, und niemand im Team kann sagen, ob CLIP, SigLIP oder etwas anderes zu Ihrem Katalog passt.

Was ich mache

Hybrides Retrieval — BM25, Dense-Vektoren und Bild-Embeddings, fusioniert mit RRF; der k-Parameter wird an Ihren Suchanfragen getunt statt auf dem Default belassen.
Reranker-Strategie — messen, wann ein Cross-Encoder seine Latenz wert ist und wann schlichtes BM25 bereits gewinnt.
Embedding-Modellwahl mit Belegen — ich habe CLIP gegen SigLIP auf einem türkisch-lastigen Katalog direkt antreten lassen und die Quittungen behalten.
Aufbau eines Eval-Harness — ein gelabeltes Query-Set aus Ihren echten Logs, damit "besser" zu nDCG und Recall wird statt zu einer Meinung im Meeting.

Zahlen statt Adjektive

Novas Katalog: 7 Millionen Produkte, drei Retrieval-Signale mit RRF fusioniert, Bildsuche über SigLIP. nDCG@10 stieg von 0,61 auf 0,74, gemessen an der echten Query-Verteilung — und der Eval-Harness ist es, der jede Tuning-Entscheidung belegbar statt diskutabel gemacht hat.

Notizen aus der Praxis

Hybrid-Suche mit Qdrant: was über BM25 + Dense + Bild keiner sagtDie Architektur hinter dem Index mit 7 Millionen Produkten.Sechs Monate RRF in Produktion: was dir k=60 nicht sagtWas der Default-Wert für k richtig machte — und wo nicht.CLIP vs SigLIP für einen türkischen Produktkatalog: eine Marken-Affinitäts-AblationEmbedding-Wahl per Messung entschieden, nicht per Vorliebe.Die Woche, in der BM25 meinen Cross-Encoder schlug — und warum ich den Reranker trotzdem behieltDie Anfrageklasse, in der der einfachste Ranker gewann.

Wo wir anfangen

Discovery: Ich evaluiere Ihre bestehende Suche gegen Ihre echte Query-Verteilung — Stichproben aus den Logs, gelabelte Ergebnisse, Messung. Sie bekommen Zahlen dazu, wo sie versagt, und eine Liste von Korrekturen, geordnet nach Wirkung statt nach Mode.

Erzählen Sie mir von Ihrer Suche