Özgür Işık Damar
LeistungenLeistung

Hybrid Search & Retrieval

Eine Suche, die Ergebnisse liefert, ist nicht dasselbe wie eine Suche, die findet. In der Lücke dazwischen verlieren Kataloge leise Umsatz — und sie ist messbar, also reparierbar.

Wann Sie mich anrufen

  • Die Suche "funktioniert" — keine Fehler, Ergebnisse kommen — aber Kunden tippen ein Produkt ein und finden Artikel nicht, die Sie tatsächlich auf Lager haben.
  • Sie wählen oder tunen eine Vektordatenbank, und die öffentlichen Benchmarks sehen Ihren Daten kein bisschen ähnlich.
  • Ihr Katalog ist mehrsprachig — Türkisch inklusive — und Tokenisierung oder Embedding-Verhalten bricht auf Arten, die in keiner Doku stehen.
  • Sie wollen Bildsuche, und niemand im Team kann sagen, ob CLIP, SigLIP oder etwas anderes zu Ihrem Katalog passt.

Was ich mache

  • Hybrides Retrieval — BM25, Dense-Vektoren und Bild-Embeddings, fusioniert mit RRF; der k-Parameter wird an Ihren Suchanfragen getunt statt auf dem Default belassen.
  • Reranker-Strategie — messen, wann ein Cross-Encoder seine Latenz wert ist und wann schlichtes BM25 bereits gewinnt.
  • Embedding-Modellwahl mit Belegen — ich habe CLIP gegen SigLIP auf einem türkisch-lastigen Katalog direkt antreten lassen und die Quittungen behalten.
  • Aufbau eines Eval-Harness — ein gelabeltes Query-Set aus Ihren echten Logs, damit "besser" zu nDCG und Recall wird statt zu einer Meinung im Meeting.

Zahlen statt Adjektive

Novas Katalog: 7 Millionen Produkte, drei Retrieval-Signale mit RRF fusioniert, Bildsuche über SigLIP. nDCG@10 stieg von 0,61 auf 0,74, gemessen an der echten Query-Verteilung — und der Eval-Harness ist es, der jede Tuning-Entscheidung belegbar statt diskutabel gemacht hat.

Notizen aus der Praxis

Wo wir anfangen

Discovery: Ich evaluiere Ihre bestehende Suche gegen Ihre echte Query-Verteilung — Stichproben aus den Logs, gelabelte Ergebnisse, Messung. Sie bekommen Zahlen dazu, wo sie versagt, und eine Liste von Korrekturen, geordnet nach Wirkung statt nach Mode.