LeistungenLeistung
Hybrid Search & Retrieval
Eine Suche, die Ergebnisse liefert, ist nicht dasselbe wie eine Suche, die findet. In der Lücke dazwischen verlieren Kataloge leise Umsatz — und sie ist messbar, also reparierbar.
Wann Sie mich anrufen
- Die Suche "funktioniert" — keine Fehler, Ergebnisse kommen — aber Kunden tippen ein Produkt ein und finden Artikel nicht, die Sie tatsächlich auf Lager haben.
- Sie wählen oder tunen eine Vektordatenbank, und die öffentlichen Benchmarks sehen Ihren Daten kein bisschen ähnlich.
- Ihr Katalog ist mehrsprachig — Türkisch inklusive — und Tokenisierung oder Embedding-Verhalten bricht auf Arten, die in keiner Doku stehen.
- Sie wollen Bildsuche, und niemand im Team kann sagen, ob CLIP, SigLIP oder etwas anderes zu Ihrem Katalog passt.
Was ich mache
- Hybrides Retrieval — BM25, Dense-Vektoren und Bild-Embeddings, fusioniert mit RRF; der k-Parameter wird an Ihren Suchanfragen getunt statt auf dem Default belassen.
- Reranker-Strategie — messen, wann ein Cross-Encoder seine Latenz wert ist und wann schlichtes BM25 bereits gewinnt.
- Embedding-Modellwahl mit Belegen — ich habe CLIP gegen SigLIP auf einem türkisch-lastigen Katalog direkt antreten lassen und die Quittungen behalten.
- Aufbau eines Eval-Harness — ein gelabeltes Query-Set aus Ihren echten Logs, damit "besser" zu nDCG und Recall wird statt zu einer Meinung im Meeting.
Zahlen statt Adjektive
Novas Katalog: 7 Millionen Produkte, drei Retrieval-Signale mit RRF fusioniert, Bildsuche über SigLIP. nDCG@10 stieg von 0,61 auf 0,74, gemessen an der echten Query-Verteilung — und der Eval-Harness ist es, der jede Tuning-Entscheidung belegbar statt diskutabel gemacht hat.
Notizen aus der Praxis
Hybrid-Suche mit Qdrant: was über BM25 + Dense + Bild keiner sagtDie Architektur hinter dem Index mit 7 Millionen Produkten.Sechs Monate RRF in Produktion: was dir k=60 nicht sagtWas der Default-Wert für k richtig machte — und wo nicht.CLIP vs SigLIP für einen türkischen Produktkatalog: eine Marken-Affinitäts-AblationEmbedding-Wahl per Messung entschieden, nicht per Vorliebe.Die Woche, in der BM25 meinen Cross-Encoder schlug — und warum ich den Reranker trotzdem behieltDie Anfrageklasse, in der der einfachste Ranker gewann.
Wo wir anfangen
Discovery: Ich evaluiere Ihre bestehende Suche gegen Ihre echte Query-Verteilung — Stichproben aus den Logs, gelabelte Ergebnisse, Messung. Sie bekommen Zahlen dazu, wo sie versagt, und eine Liste von Korrekturen, geordnet nach Wirkung statt nach Mode.