KI-Vector-Search-Bug: Pyjamas zum Date Night

Alle glaubten, semantische Suche sei Plug-and-Play-Magie für E-Commerce-Chatbots. Dann spuckte die KI eines Devs Pyjamas für Date-Nights aus – und zeigte, wie Vector-Ähnlichkeit bei echten Absichten patzt.

KI-Chatbot empfiehlt gemütliche Pyjamas für Date-Night-Outfit-Anfrage

Key Takeaways

  • Vector-Ähnlichkeit allein patzt bei Einkaufsabsichten – immer Fallbacks stapeln.
  • Pyjama-Bug entlarvt Embeddings-Kontextblindheit; Hybrid-Suche rettet den Tag.
  • OpenAI kassiert Embed-Gebühren, Devs zahlen mit Tweaks – Reranker übernehmen.

Schaut her, uns allen wurde der Traum verkauft: OpenAI-Embeddings auf den Produktkatalog klatschen, Supabase-Query starten, zack – euer Chatbot wird Einkaufsgenie und nagelt jeden vagen Kundenwunsch.

Aber Ali, der in Gaza an Provia schuftet (ja, AI-Verkaufsplattform inmitten von Chaos bauen), knallte gegen die Wand. Kunde tippt ‘zeig mir was für Date Night’, Top-Treffer? ‘Cozy Night Deluxe Loungewear Set.’ Pyjamas. Denn in der nebligen 1536-dimensionalen Suppe des text-embedding-3-small sind ‘date night’ und ‘night loungewear’ verwandte Seelen.

Warum Vector-Suche bei Einkaufsabsichten scheitert

Semantische Suche? Eher semantischer Reinfall. Sie misst kosmische Distanzen zwischen Wortwolken, nicht menschliche Shopping-Vibes. ‘Outfit für Nachtausgang’ – Pyjamas. ‘Gute Nachtcreme’ – immer noch Pyjamas. Dieses Nachtwäsche-Schwarzes-Loch saugte alles mit ‘night’-Geruch auf, dank keywordgestopfter Namen und Beschreibungen.

Ali packt es roh aus:

Ein Kunde tippte “zeig mir was für Date Night” – und mein AI-Chatbot spuckte das “Cozy Night Deluxe Loungewear Set” – Pyjamas – als Top-Ergebnis aus. Weil “night” in “date night” semantisch nah an “night” im “loungewear set” ist.

Harsch. Und das in einem winzigen Katalog mit 15 Produkten. Skaliert auf Shopifys Millionen? Albtraum pur.

Setup war lehrbuchmäßig: Produkte mit OpenAI-Modell embedden, Query embedden, Cosinus-Ähnlichkeit via pgvector in Supabase. Schwellwert bei 0,1 – lächerlich lax. Alles Englisch-Nah dran kam durch.

Erster Fix? Auf 0,3 hochdrehen. Pyjamas weg. Auch ‘zeig mir Jacken’ – 0,28 bei ‘Classic Cool Denim Jacket.’ Zu streng für knappe Queries.

Zwei-Stufen-Hack: Starke Matches über 0,3, Nahe 0,2-0,3 als ‘Vorschläge.’ Schlimmer. Bot empfahl Pyjamas als ‘könnte passen’, gleicher Müll-UX.

Auf 0,25, 10 Ergebnisse holen. Lärmexplosion. Pyjamas hängen mit, Bot quatscht sie manchmal an.

Sind OpenAI-Embedding-Modelle für E-Commerce nutzlos?

Nicht nutzlos. Nur kontextblind. Vector-Raum gruppiert Konzepte nach Ko-Okkurrenzstatistiken, nicht Käuferpsychologie. Date-Night-Kleider? Fehlanzeige, gemütliche PJs siegen durch ‘night’-Nähe. Wie 90er-Keyword-Suche auf Steroiden – gleiche Fallen, schicker Mathe.

Mein ungenierter Hot Take aus Alis Post: Das erinnert an AltaVistas Kollaps. Erinnert ihr? Frühe Web-Suche ertrank in Spam-Seiten mit heißen Keywords. Google zerquetschte mit PageRank-Intent-Signalen. Heutige Vector-Shops brauchen das – Hybrid-Rankings mit Embeddings plus Regeln, Kategorien, sogar Verkaufsgeschwindigkeit. Ohne? Zahlt ihr OpenAI-Embed-Gebühren, während Kunden abhauen.

Alis Gewinner: Fallback-Kette. Keine Matches bei 0,3? Keine Panik.

Schritt 1: Enge semantische Suche (0,3 Schwellwert).

Schritt 2: Keyword-Fallback – Full-Text-Suche auf Name/Beschreibung.

Schritt 3: Kategorie-Breitscan – bei ‘outfit’-Hinweis Apparel durchforsten.

Schritt 4: Null Ergebnisse? ‘Erzähl mehr’-Prompt.

Code entwickelte sich clever. Func-Defaults jetzt 0,3, App schichtet Fallbacks:

// Pseudo-ish
if (semanticResults.length === 0) {
  keywordResults = await supabase.rpc('keyword_search', {query});
  if (keywordResults.length === 0) {
    catResults = await get_category_products(extract_category(query));
  }
}

Ergebnis? Date Night holt jetzt Kleider, Tops. Keine Nachtwäsche-Verführung mehr.

Aber der Zynismus: Wer kassiert? OpenAI pro Embed. Supabase pro Query. Devs wie Ali opfern Nächte für Tweaks. Kunden? Misstrauisch gegenüber AI-Empfehlungen. Kleine Kataloge entkommen dem Schlimmsten, aber Enterprise-E-Commerce? Braucht Ingenieurarmeen – oder wechselt zu agentischen Chains (teuer).

Wer profitiert von diesen AI-Verkaufs-Patzer?

Venture-Typen hypen ‘AI-native Commerce.’ Realität: Zerbrechlich. Ein viraler Pyjama-Tweet killt Vertrauen. Ali aus Gaza – Respekt, dass er liefert trotz Stromausfällen – aber seine Story brüllt: Embeddings sin

Marcus Rivera
Written by

Tech journalist covering AI business and enterprise adoption. 10 years in B2B media.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by dev.to