Entwurf 2026-05-19 v1 — korrigiert

Technisches Konzept

Wir berechnen Relevanz statt sie zu definieren — und stellen damit den Kern von pxmize.ai vom Kopf auf die Füße.

Strategische Neuausrichtung der technischen Umsetzung. Context Handler als Herzstück, zweistufige Validierung, pragmatischer Daten-Pfad, archetyp-neutrale Architektur.

Sequencing-Prinzip

Erst das Herzstück validieren. Dann der erste Touchpoint. Dann jeder weitere. Am Ende: Enterprise.

00 — Zusammenfassung

Worum es geht

Die PXMIZE-Vision (Tailor-made Product Content über alle Touchpoints) ist tragfähig. Die heutige technische Umsetzung von pxmize.ai aber baut auf einer falschen Prämisse: sie rät Personas, definiert Criteria manuell und mappt deterministisch Kontext → Variante.

Dieses Konzept dreht die Logik um: ein Context Handler wird zum Herzstück der Architektur. Er nutzt brand-spezifische Repräsentationen, die aus realen Daten der Brand abgeleitet werden, und entscheidet je Request, welcher Content für die konkrete Situation am relevantesten ist.

Sequencing-Prinzip: Der Context Handler muss zuerst validiert werden — alles andere baut darauf auf. Funktioniert das Herzstück, expandiert pxmize.ai sukzessive entlang der Vision: erst PDP (Live A/B), dann weitere Touchpoints (Email, Ads, POS, Print), am Ende ein vollständiges Enterprise-Produkt. Kleiner Kern, ehrlich validiert, dann skaliert.

Validierung zweistufig: Phase A kombiniert quantitativen Holdout-Test mit qualitativem Brand-Team-Review. Phase B liefert den Live-A/B-Wertbeweis. Daten-Pfad zweistufig: pseudonymisierte Auszüge in pxmize-Cloud zum Start, Brand-Cloud-Deployment ab Phase B. Architektur archetyp-neutral entlang eines klaren Kerns und dünner Adapter.

01 — Problem & Hypothese

Was am bisherigen Ansatz nicht passt

Der aktuelle pxmize.ai-MVP baut Funktionen entlang unstrukturierter, unvalidierter Annahmen:

Generische Personas ("Jack Business", "Lisa Nature Lover") werden vordefiniert, ohne dass die Brand sie als ihre echten Kunden wiedererkennen muss.
Criteria werden manuell konfiguriert und sind kombinatorisch starr.
RACE / Redis-RTIM materialisiert ein deterministisches Mapping — skaliert nur, solange Variantenzahl klein bleibt.
Variant Generation läuft batch-orientiert ohne Lernsignal aus realem Nutzungsverhalten.
Validierung ist output-getrieben, nicht outcome-getrieben.

Konsequenz: man baut Features, von denen man glaubt, sie seien wichtig. Es gibt keinen Lernkanal, der diese Annahmen früh widerlegen oder bestätigen würde.

Drei Ziele dieses Konzepts

PMF-Validierung — strukturiert lernen, für wen TMPC ein echtes Problem löst und welche Funktionen den Wert tragen.
Demo-Fähigkeit — Format, das die Idee glaubwürdig transportiert.
PoC mit 1–2 Brands — echte Daten, ehrliches Lernsignal.

02 — Konzeptioneller Kern

Der Context Handler

Analogie als Leitbild, nicht als Implementierung

Die Attention-Mechanik aus Transformer-Modellen ist eine nützliche konzeptuelle Analogie: Kunden-Kontext (Query) und Produkt-Kontext (Key/Value) als Repräsentationen, Relevanz wird berechnet statt vordefiniert.

Wichtig: das ist ein Leitbild, kein Implementierungs-Versprechen. Die tatsächliche Realisierung im PoC ist pragmatischer:

PoC-Substrat: Vector-Retrieval (Embeddings für Kunden- und Produkt-Repräsentationen in gemeinsamem Raum) + LLM-Rerank/Reasoning für die finale Auswahl.
Mittelfristig (Phase B+): Learned Ranking auf Basis realer Konversions-/Klick-Signale.
Echte Attention-/Two-Tower-Modelle: Erweiterungsoption, kein Tag-1-Bestandteil.

Was der Context Handler ist (und was nicht)

Ist: Eigenständige Komponente, die je Request entscheidet, welche Variante (vorgeneriert oder on-the-fly) für die konkrete Kunden-Situation am relevantesten ist. Brand-spezifisch in der Repräsentation. Architektur-Kern, von dem alles andere abhängt.

Ist nicht (bewusst): Kein vollständig "self-learning"-Modell im engeren Sinn. PoC ist Bootstrap-Learning aus historischen Daten (einmalige Repräsentations-Ableitung). Online-Learning kommt erst in Phase B+.

Erklärbarkeit als Pflichtteil

Brand-Akzeptanz erfordert, dass das System erklären kann, warum eine Variante gewählt wurde. Konkret zwei Mechanismen:

Retrieval-Citations: pro Variant-Entscheidung werden die zugrunde liegenden Repräsentations-Treffer mitgeliefert (z. B. "Kunde gehört zu Segment X mit Affinität Y zu Produkt-Eigenschaft Z").
Signal-Attribution: welche Kontext-Signale den Ausschlag gegeben haben, wird als kompakte Liste mitgeliefert.

RAG ist natürlich erklärbar — retrieved Documents sind sichtbar. Diese Erklärungs-Daten fließen in Approval-Workflow, Insights UI und optional in den Endkunden-Touchpoint.

02.5 — Repräsentation

Der Kontext ist ein Graph

Die Welt, mit der der Context Handler arbeitet, ist relational. Wir modellieren sie explizit als Graph — und genau das trägt den USP.

Ausschnitt aus dem Context-Graph für zwei Kunden. Pink-Kanten = gelernte Affinität (cosine_similarity zwischen Customer- und Attribute-Embedding), Linienstärke ∝ Gewicht. Weiße Kanten = strukturelle Komposition (welche Attribute aus welchen Produkten extrahiert wurden). cust_a hat hohe Nähe zu Attributen, aus denen aero_t9 komponiert ist; cust_b hat hohe Nähe zu urban_x4. Geteilte Attribute (premium, akku) erzeugen Ambiguität, die das Reranking-Layer auflöst. Niemand hat dieses Mapping definiert — es entsteht aus dem Brand-spezifischen Bootstrap.

Knoten

Entity-Typen im Graphen

Kunden — aggregiertes Verhaltens-Profil
Produkte — Attribute, Texte, Assets
Segmente — explizit definiert oder via Community-Detection aufgedeckt
Kontext-Signale — Location, Daypart, Saison, Wetter, Event, Kampagne, Device
Touchpoints — PDP, Email, Ad, POS (pro hinzugekommenem Tier)

Kanten (typisiert)

Relationen tragen Bedeutung

Kunde → Produkt: hat gekauft, angesehen, verglichen, wishlisted
Produkt → Produkt: ergänzt, alternative zu, gleiche Familie
Kunde → Kunde: ähnlich zu (Lookalike, abgeleitet)
Produkt → Kontext: passt zu
Kunde → Segment: gehört zu
Kunde → Kontext: aktuell in (Session-Kontext)

Warum das so wichtig ist

Relevanz ist in dieser Welt Multi-Hop: „Welche Produkte sind für diesen Kunden in diesem Kontext relevant?" lässt sich nicht aus flachen Tabellen oder reinen Ähnlichkeits-Vektoren ableiten — sondern erst, wenn man Pfade durch den Graphen verfolgt. Genau diese Pfad-Logik ist auch das Substrat unserer Erklärbarkeit: jede Variant-Entscheidung lässt sich als konkreter Pfad durch den Graphen visualisieren.

Wie wir das implementieren

Im PoC speichern wir den Graphen nicht in einer dedizierten Graph-DB — das wäre Ops-Overkill. Stattdessen:

Relationaler Store (PostgreSQL mit Adjazenz-Tabellen) für die Graphstruktur
Graph-aware Embeddings — Random-Walks über den Graphen erzeugen Trainings-Sequenzen für die Vektor-Modelle (Node2Vec / DeepWalk-Logik)
Im Betrieb: leichtgewichtiger Vector-Store. Die Graph-Information ist in den Vektoren kodiert, nicht zur Request-Zeit traversiert

Konzeptionelle Ehrlichkeit, ops-leicht

Konzeptionell: die Welt ist ein Graph, das Modell weiß das. Ops: keine Graph-DB im Betrieb. In Phase 3+ kann eine dedizierte Graph-DB als Tier nachgerüstet werden — falls Multi-Hop-Live-Queries oder GNN-Training nötig werden.

02bis — Sequencing-Prinzip

Erst das Herzstück. Dann die Touchpoints. Dann Enterprise.

Der Context Handler ist nicht eine Komponente unter vielen — er ist die Komponente, deren Funktionieren über die Lebensfähigkeit des gesamten Produkts entscheidet. Daraus folgt eine investitionsrationale Build-Order.

Warum diese Reihenfolge

Wenn Phase A nicht trägt, ist alles Weitere Geldverbrennung — daher zuerst dort validieren.
Wenn Phase B trägt, haben wir gleichzeitig den Wertbeweis und den ersten produktreifen Touchpoint — die Basis, von der wir uns finanzieren und weiterentwickeln.
Jedes weitere Touchpoint-Tier ist eine Erweiterung des gleichen Kerns, kein Neubau.

Was das nicht ist

Kein Wasserfall — innerhalb jeder Phase wird iterativ gearbeitet.
Keine starre Roadmap — Phasen-Reihenfolge ist Logik, nicht Vertrag.
Keine Touchpoint-Stapelung um ihrer selbst willen — jeder weitere TP muss seinen Business-Value zeigen, sonst priorisieren wir um.

Konsequenz für alle weiteren Entscheidungen

Architektur, Datenstrategie, Validierung und Roadmap in diesem Konzept folgen dieser Build-Order. Wenn an irgendeiner Stelle eine Entscheidung getroffen werden muss, ist die Default-Frage: „Trägt das den Context Handler zuerst?" Alles andere kommt danach.

03 — Datenstrategie

Lernschleifen & Data Residency

Zwei Lernschleifen sauber getrennt. Ein zweistufiger Daten-Pfad, der den Setup-Widerspruch auflöst.

Zwei Schleifen

Bootstrap-Learning

Offline, einmalig pro Brand, mit periodischem Re-Run

Input: Orders, Customer-Master, Web-Analytics (90+ Tage), Produktkatalog, optional Reviews/Newsletter
Output: brand-spezifische Embeddings, Segmente, Affinitäten, Persona-Hypothesen
Zweck: Kaltstart vermeiden — Tag 1 hat das System brand-spezifische Struktur
Wiederholung: alle paar Wochen, nicht kontinuierlich

Online-Learning

Kontinuierlich, erst in Phase B+ scharf

Input: Clicks, Konversionen, Dwell, A/B, Approval/Rejection
Output: Re-Ranking-Updates, Counterfactual-Learning für Variant-Auswahl
Zweck: Modell wird über Zeit besser ohne erneute Bootstrap-Runs
Status PoC: Infrastruktur vorhanden, Loop deaktiviert

Realitätscheck Datenquellen

Für den ICP (Tier 1 × Mid-Market) gilt: Order-Daten allein sind ein schwaches Signal. Niedrige Wiederkaufsfrequenz (Miele alle 10 Jahre, Bogner saisonal, Specialized alle 5 Jahre) erzeugt viele "Customer = 1 Order"-Cases ohne lernbare Struktur. Das eigentliche Relevanzsignal sitzt prä-Konversion.

Minimal-Anforderung

Orders + Customer-Master + 90 Tage Web-Behavior (GA4-Export oder gleichwertig). Reine Order-CSV reicht nicht.

Data Residency — zweistufiger Pfad

Hier wird der Setup-Widerspruch ("schneller PoC vs. Brand-Cloud") bewusst aufgelöst:

Stufe 0 — Phase A

pxmize-Cloud, pseudonymisiert

Brand exportiert pseudonymisierte Daten-Auszüge (PII durch Hash ersetzt). Verarbeitung in pxmize-Cloud unter DPA.

Setup-Zeit: Tage
Geringe Friction
Ausreichend für PMF-Validierung
Sales-Material: "so schnell kommen wir ins Lernen"

Stufe 1 — Phase B / Pre-GA

Brand-Cloud, vollständige Residency

Bootstrap-Trainer und Inferenz-Stack in Brand-Account deployed. Daten verlassen die Brand-Zone nicht mehr.

Setup-Zeit: Wochen bis Monate
Erforderlich bei strikter Residency-Policy
Identische Komponenten wie Stufe 0
Enterprise-Material: "läuft auch in eurer Cloud"

Methoden-Wahl (PoC-Substrat)

Konsistent mit dem Graph-Repräsentations-Modell aus §02.5:

Context-Graph als Persistenz-Modell — Knoten + typisierte Kanten. Im PoC ohne dedizierte Graph-DB: PostgreSQL mit Adjazenz-Tabellen (oder pgvector mit Edge-Tabellen).
Graph-aware Embeddings — Random-Walks über den Graphen (Node2Vec / DeepWalk) erzeugen Trainings-Sequenzen für die Vektor-Modelle. So fließt die Relationsstruktur in die Vektoren ein.
Vector-Store für Retrieval (pgvector im PoC, Qdrant/Pinecone bei Skalierung).
LLM-Rerank / Generation mit Retrieval-Citations + Graph-Pfad als Erklärungs-Output.
Klassische Segmentation (RFM, Community-Detection auf dem Graphen) als ergänzendes Layer.

Was nicht zum PoC gehört: dedizierte Graph-DB (Neo4j, TigerGraph), Graph Neural Networks, eigenes Fine-Tuning der Embedding-Modelle. Kommt in Phase 3+ bei Bedarf.

04 — Validierungs-Strategie

Zwei Stufen, beide methodologisch sauber

Frage: Erkennt unser System echte, vorhersagestarke Struktur in den Brand-Daten?

Zwei parallele Validierungs-Pfade — nicht nur qualitatives Bauchgefühl:

Quantitativ — Holdout-Test gegen historische Daten. Zeitlicher Split (75/25). System lernt auf Trainings-Daten, macht falsifizierbare Vorhersagen auf Holdout. Gegen Random-Baseline und Heuristik-Baseline gemessen. Lift muss messbar sein.
Qualitativ — Brand-Team-Review. Rated Segmente, Persona-Hypothesen, PDP-Beispiele. Nicht "ja/nein/teilweise", sondern welche Aspekte anschlagen — mildert Confirmation Bias.

Kein Live-Deployment auf PDP nötig.

Frage: Führt erkannte Relevanz zu echtem Business-Value?

Input: validierte Phase-A-Repräsentationen + Live-Traffic
Processing: Context Handler entscheidet per Request
Output: A/B-Test gegen Status-quo-Content auf ausgewählten PDPs
Validierung: Conversion-Uplift, AOV, Engagement — quantitativ
Aufwand inkl. Brand-Cloud-Deployment, Touchpoint-Integration, Approval-Workflow, statistische Signifikanz-Wartezeit

Übergang A → B

Architektur muss so gebaut sein, dass die Bootstrap-Pipeline aus A die gleichen Repräsentationen erzeugt, die in B online serviert werden. Kein Re-Build, nur Aktivierung des Online-Inferenz-Pfads + Touchpoint-Integration.

05 — Zielgruppe

ICP & Archetypen

Primärer ICP nach Y1-Matrix: Tier 1 × Mid/Upper Mid Market. Innerhalb dessen zwei radikal verschiedene Archetypen — die gleiche Engine bedienen kann.

Sweet Spot: Tier 1 × M bis L, Online-Umsatz ~10–100 Mio EUR. Komplexes Produktdatenmodell, hoher Conversion- und PX-Fokus, emotionale UX. Schnellere Entscheidungswege als Enterprise.

Zwei Archetypen innerhalb Tier 1

α — B2C Premium-Lifestyle

Bogner, Specialized, Miele, Villeroy & Boch, Everdrop, MYCS

Kontext-Signale: Lebenswelt, Stimmung, Use-Occasion, Saison, Lookbook
Match-Logik: emotional/aspirational, semantisch reich, viel Unstructured
Datenstärke: Browse-Pfade, Wishlist, Newsletter-Engagement

β — B2B High-Tech / Industrial

Festo, Maxon, Liebherr, Bosch Industrial, Baumer, Fischer

Kontext-Signale: Anwendungsfall, technische Spec, Industrie, Account-Firmographics
Match-Logik: funktional/spec-getrieben, hoch strukturiert
Datenstärke: Konfigurator-Sessions, RFQ, Datenblatt-Downloads

Archetyp-Neutralität — was das konkret heißt

Eine Engine für beide Archetypen funktioniert nur, wenn klar getrennt wird zwischen Kernel und Adapter:

Kernel (gemeinsam): Embedding-Store, Retrieval-Engine, LLM-Rerank/Generation, Approval-Workflow, Insights UI, Online-Loop-Infrastruktur. Identisch über beide Archetypen.
Repräsentations-Adapter (archetyp-spezifisch): bestimmt, wie Kunden- und Produkt-Repräsentationen aufgebaut werden.
- α-Adapter: textreich, lifestyle-orientiert, gewichtet Verhaltens-Pfade hoch.
- β-Adapter: spec-orientiert, gewichtet strukturierte Attribute und Firmographics hoch.

Adapter sind dünn (Input-Formatierung, Source-Selection, Prompt-Templates), nicht ganze Pipelines. Großteil der Engine bleibt wirklich gemeinsam.

06 — Architektur

Ziel-Architektur & Reuse-Entscheidungen

Zwei Deployment-Zonen, identische Komponenten. LLM-Hosting und Online-Loop explizit gemacht.

Komponenten-Übersicht

LLM-Hosting — pro Brand entschieden

API-Provider (Anthropic, OpenAI): schnell, mit DPA. Stufe-0-Default.
Self-hosted in Brand-Cloud (z. B. Llama-3, Qwen auf Brand-GPU): für strikte Residency.
pxmize-gehosteter Pool: für Stufe 0, falls Brand keine API-Provider akzeptiert.

Entscheidung pro Brand im Onboarding. Vom Architektur-Kern entkoppelt — Inference Endpoint abstrahiert das LLM-Backend.

Online-Feedback-Loop

STRIVE-Events (Clicks, Konversionen, Dwell, Approvals) landen im Feedback Store. In Phase B periodisch verarbeitet: Re-Ranking-Update + Re-Embedding-Trigger bei ausreichendem Datenvolumen. Loop ist in Phase A vorhanden, aber inaktiv.

Reuse vs. Rebuild

Komponente	Heute	Entscheidung
Variant Generation	LLM-PCV aus Personas + Criteria	Reuse Context-Handler-getrieben
Target Manager	Publiziert zu RACE	Retire Rolle → Asset-Publisher
RACE / Redis RTIM	Deterministisches Mapping	Retire optional Cache-Layer
pxmize.js	Touchpoint-Injection	Reuse Endpoint wechselt
STRIVE	Event-Tracking	Reuse Feedback Store für Phase B
Cloudinary	DAM / CDN	Reuse agnostisch
Onedot	Produktdaten-Transform	Reuse Katalog-Ingest
aiuno	Conversational Commerce	Defer Phase 3+
Personalisation Manager UI	Persona/Criteria-Verwaltung	Retire → Insights-Explorer

Brand-Kontrolle

Approval-Workflow ist Pflichtteil, nicht Bonus. Generierte Varianten gehen niemals ungeprüft live. Brand-Voice-Guardrails sind Teil der Repräsentation, nicht nur ein Prompt-Suffix. Override-Möglichkeit pro PCV ab Tag 1.

07 — Demo-Konzept

Demo — separat vom PoC, mit Wow-Moment

Eine Demo pro Archetyp. Interaktiv. Mit Erklärungs-Panel. Plus „Bring your own catalog"-Modus für Sales-Calls.

Zweck

Die Demo macht in 5–10 Minuten zwei Dinge greifbar:

Kontext-Wirkung: ändere ich Kunden-Kontext, ändert sich die Product Experience nachvollziehbar.
Erklärbarkeit: ich sehe, warum sich was geändert hat — nicht als Magic-Box.

Demo α — B2C Premium-Lifestyle

Beispiel: fiktive E-Bike-Brand „RIDGEFORM". 4–6 Produkte aus öffentlichem Katalog.

Location

Schwarzwald Berlin Mallorca

Daypart

Morning Afternoon Evening

Saison

Sommer Herbst Winter

Persona-Hypothese Touring-Enthusiast

Wetter Sonnig

Hero-Bild · Wald-/Trail-Szene

Endless Touring · RIDGEFORM Aero T9

Für die langen Strecken am Sonnenwochenende.

Mit 200 km Reichweite ist das Aero T9 dein Begleiter, wenn die Tour weiter geht als nur bis zum nächsten Café. Schwarzwald-Trails, Sommer-Hitze, du.

200 km Reichweite Trail-Mode Heat-tolerant Akku

Warum diese Variante? — Signal-Attribution

Location: Schwarzwald → Trail-Optik Persona: Touring-Enthusiast → Reichweite-Headline Saison + Wetter → Sommer-Tour-Erzählung Daypart Afternoon → Wochenend-Framing

Demo β — B2B High-Tech

Beispiel: fiktiver Sensor-Hersteller „NORDLINE Industrial". 4–6 Produkte aus Industrie-Katalog.

Technische Detail-Aufnahme · Sensor in Clean-Room-Umgebung

NORDLINE PressSense X12 · Pharma-Edition

Validierte Drucküberwachung für GMP-konforme Pharma-Produktion.

±0,05 % Genauigkeit über den vollen Messbereich. Hygienic-Design nach 3-A Sanitary Standards. Direkt validierbar nach FDA 21 CFR Part 11. IO-Link für nahtlose Integration in eure SCADA-Landschaft.

±0,05 % Accuracy 3-A Sanitary FDA 21 CFR Part 11 IO-Link

RFQ anfragen Datasheet (DE/EN)

Warum diese Variante? — Signal-Attribution

Industrie: Pharma → GMP/FDA-Framing Rolle: Engineering → Spec-fokussierte Headline Use-Case: Custom → RFQ statt Buy-Button Account: Enterprise → SCADA-Integrations-Hint

Bonus-Modus: "Bring your own catalog"

Für PXM-Days und Sales-Calls mit hohem Wow-Bedarf:

Sales-Person gibt eine Produkt-URL ein (z. B. von der Brand-Webseite des Prospects).
Demo scrapet 3–5 Produkte (über Onedot-light oder simple Headless-Browser-Funktion).
Bootstrap-Run-Light (vereinfacht: nur Produkt-Embeddings, generische Personas) — innerhalb von 30–60 Sekunden.
Anschließend interaktive α-style Personalization auf deren Katalog.

Erzählmoment

"Wir haben eure Produkte gerade gelesen und können jetzt zeigen, wie wir Kontext darüber legen würden."

Tech-Architektur Demo

Frontend

Single-Page-App · Vanilla JS oder Solid/React · schlank, kein Build-Schwergewicht

Backend

Cloudflare Worker oder Hono/FastAPI · LLM-Calls via Anthropic / OpenAI

Daten

Statische JSON-Kataloge · In-Memory Vector-Store · kein Persistenz-Layer

Was die Demo nicht ist

Kein Persistenz, keine User-Accounts, keine echten Brand-Daten.
Kein Beleg für Phase-A-Validität — sie ist Storytelling, nicht Evidenz.
Kein Vorgriff auf das PoC-UI — Demo darf vereinfachen, wo PoC-UI Vollständigkeit braucht.

08 — Roadmap

Phasen-Skizze, realistische Zeiten

Zeitliche Übersetzung des Sequencing-Prinzips aus §02bis: erst Herzstück validieren, dann Touchpoint-für-Touchpoint expandieren.

Konzept finalisieren, Stakeholder-Alignment
Demo-Konzept ausdetaillieren (dieses Doc)
Ziel-Brand-Liste mit Y1 priorisieren

Demo (eine pro Archetyp) lauffähig
"Bring your own catalog"-Modus implementiert
Bootstrap-Trainer-Skelett (Stufe 0, pxmize-Cloud)
Erste Discovery-Calls mit Pilot-Brand-Kandidaten

1–3 Pilot-Brands ausgewählt
Daten-Ingest via pseudonymisiertem Auszug
Bootstrap-Run, Holdout-Test, Insights-Report
Brand-Team-Validierung, Iteration

Brand-Cloud-Deployment vorbereiten und ausrollen
pxmize.js Touchpoint-Integration, STRIVE-Event-Loop, Approval-Workflow
A/B-Test auf ausgewählten PDPs
Business-Value-Messung

Online-Learning-Loop scharf
Weitere Touchpoints (Email, POS, Ad)
Commercial Model finalisieren

09 — Offene Punkte

Nicht in diesem Konzept entschieden

ML-Methoden-Detail pro PoC — konkrete Embedding-Modelle, Vector-Store-Auswahl, Cluster-Verfahren — pro Brand entschieden.
Brand-Cloud-Deployment-Format (Stufe 1) — Container vs. Clean Room vs. Helm — beim ersten Stufe-1-Pilot entschieden.
Online-Learning-Mechanik im Detail — Bandit vs. Re-Ranking-Update, Re-Embedding-Frequenz — vertagt bis Phase B konkret.
Pricing-Modell — orthogonal zur Architektur, parallel von Sales/PM.

10 — Nächste Schritte

Direkt anschließend

Review dieses Konzepts (v1, korrigierte Fassung).
Brand-Kandidaten-Shortlist mit Y1 erstellen (Tier 1 × M/M-L, je 3–5 für α und β).
Implementation Plan für Phase 1 (Demo + Bootstrap-Trainer-Skelett) schreiben.
Cloudflare Pages Deployment dieses Doc-Sites für Stakeholder-Sharing.

Ende v1 · korrigierte Fassung · 2026-05-19