KI-SaaS-Plattform
KI-SaaS für Social-Media-Content mit Stripe & Credit-System
Production-ready SaaS für Social-Media-Creator: 20+ KI-Generatoren (Bilder, Reels, Videos, Voiceovers), gestaffelte Stripe-Subscriptions und ein atomares Credit-System. Multi-Provider-Orchestrierung über OpenAI, Gemini, Runware und ElevenLabs.
Herausforderung
Social-Media-Creator jonglieren täglich mit fünf bis zehn Tools — eines für Bildgenerierung, eines für Video, eines für Captions, eines für Scheduling. Das Wechseln ist langsam, teuer und unterbricht den Kreativ-Flow. Es gab kein Werkzeug, das alle Schritte unter einem konsistenten Subscription-Modell und mit margenoptimiertem Kostenmodell vereint.
Lösung
Eine einheitliche KI-SaaS, in der Creator Bilder, Reels, Videos, Voiceovers, Memes und Post-Texte an einem Ort generieren — bezahlt über drei abgestufte Subscription-Tiers mit credit-basiertem Verbrauch. Multi-Provider-Orchestrierung mit Fallback-Logik und einer atomaren Credit-Deduktion auf Postgres-Function-Ebene, die Race-Conditions auch bei parallelen Jobs sicher ausschließt.
Ergebnisse
✓20+ KI-Generatoren in einem Produkt — Bilder, Reels, Videos, Voiceovers, Memes, Posts
✓Stripe-Subscription-Infrastruktur mit drei Tiers, Trial-System und monatlichem Reset
✓Atomare Credit-Deduktion auf Postgres-Function-Ebene — keine Race-Conditions
✓Margenmodell mit 40-75% Spanne über alle KI-Provider hinweg gemodellt
✓Async-Job-Pipeline mit externem Worker und Webhook-Callbacks
✓596 Commits, 57+ API-Routen, 30+ User-facing Pages — produktiv mit zahlenden Nutzern
Eingesetzte Technologien: Next.js 16 · React 19 · TypeScript · Supabase · Stripe · OpenAI · Gemini · Runware · ElevenLabs · Tailwind CSS
Voice-KI-Plattform
Voice-KI-Plattform für medizinisches Kommunikationstraining
Browser-basiertes Voice-KI-Trainingstool, in dem Ärzte schwierige Patientengespräche mit emotional konsistenten KI-Patienten üben. Spracherkennung, Dialog und Sprachsynthese als Round-Trip unter zwei Sekunden — ohne App-Installation.
Herausforderung
Medizinische Kommunikationskompetenzen — etwa Diagnoseaufklärung oder das Gespräch mit impfskeptischen Eltern — sind klassisch nur mit gebuchten Schauspielern und Coaches trainierbar. Das skaliert nicht und liefert keine objektive Auswertung. Vorhandene digitale Lösungen sind entweder textbasiert (kein realer Sprechreiz) oder verlangen eine native App-Installation, was an Klinikrechnern oft nicht möglich ist.
Lösung
Eine browser-only Trainings-Plattform, auf der Lernende mit KI-Patienten sprechen, die über die gesamte Session einen emotionalen Zustand halten und konsistent reagieren. Browser-Audio-Capture, Whisper-STT, Claude-Sonnet-Dialog und ElevenLabs-TTS sind zu einer Streaming-Pipeline kombiniert. Nach jeder Session bewertet ein zweites KI-Modell den vollständigen Transkript und liefert strukturiertes Feedback mit Empathie-Score, Klarheit und konkreten Verbesserungsvorschlägen.
Ergebnisse
✓Round-Trip unter zwei Sekunden vom Sprechen bis zur Antwort
✓Drei Voice-Provider in einer synchronen Low-Latency-Pipeline orchestriert
✓Emotional konsistente KI-Patienten über mehrere Gesprächsrunden
✓Strukturiertes Feedback nach jeder Session — Empathie-Score, Schlüsselsätze, nächste Schritte
✓Per-Provider Token-Tracking — exakte Marge pro Session berechenbar
✓Live im Einsatz mit aktiven medizinischen Nutzern
Eingesetzte Technologien: Next.js 16 · React 19 · TypeScript · Anthropic Claude · Groq Whisper · ElevenLabs · PostgreSQL · NextAuth v5
KI-Coaching mit Long-Term Memory
KI-Coaching-Plattform mit echtem Langzeitgedächtnis
Vier KI-Coaches (Health, Business, Relationship, Selfcoaching), die sich über Sessions hinweg an Nutzer erinnern. Ein Hintergrund-Summarizer extrahiert Notizen, Insights und Profilfakten und injiziert sie in spätere Gespräche — Coach 2 weiß, was Coach 1 schon gelernt hat.
Herausforderung
Standard-Chatbots starten jedes Gespräch bei null. Für ein Coaching-Produkt — wo der gesamte Wert auf 'der Coach kennt mich' beruht — ist das der Unterschied zwischen einem Tool und einem Spielzeug. Echtes Long-Term-Memory richtig zu bauen ist anspruchsvoll: man muss aus unstrukturierten Gesprächen strukturierte Signale extrahieren, sie speichern, ohne den Context-Window zu sprengen, und an der richtigen Stelle wieder einspielen.
Lösung
Eine Vier-Persona-Plattform, in der jeder Coach ein dauerhaftes Gedächtnis über alle Gespräche hinweg aufbaut — und relevante Insights mit den anderen Coaches teilt. Antworten streamen in Echtzeit von Claude Sonnet, während im Hintergrund ein günstigeres Haiku-Modell strukturierte Notizen, coach-übergreifende Insights und ein Profil pro Nutzer extrahiert. Bei jeder neuen Nachricht werden die letzten 20 Notizen, 10 Cross-Coach-Insights und das Coach-Profil ins System-Prompt eingespielt.
Ergebnisse
✓Zwei-Tier-Modell-Architektur — Sonnet für Antworten, Haiku für Hintergrund-Summaries
✓Strukturierte Notes in fünf Kategorien pro Coach (Stärken, Schwächen, Muster, Ziele, offene Themen)
✓Coach-übergreifende Insights mit Quellen-Provenance
✓Token-by-Token Streaming via Server-Sent Events
✓Saubere Fünf-Tabellen-Architektur in Supabase mit Cascading Deletes
✓Cost-per-Message explizit pro Tier nachvollziehbar
Eingesetzte Technologien: Next.js 16 · React 19 · TypeScript · Anthropic Claude Sonnet · Anthropic Claude Haiku · Supabase · PostgreSQL · Server-Sent Events · Tailwind CSS v4
Pinterest Multi-Account Automatisierung
Multi-Account Pinterest-Automatisierungs-Plattform
Produktions-Tool für Agenturen und Publisher mit mehreren Pinterest-Accounts. KI generiert Pins (Bild + Titel + Beschreibung) im Bulk, plant sie über Boards mit smartem Spreading und veröffentlicht über die offizielle Pinterest API — rate-limit-aware mit Auto-Pause.
Herausforderung
Pinterest-Wachstum bei mehreren Accounts ist ein manueller Albtraum: einloggen, Account wechseln, Pin in Canva designen, Titel schreiben, Beschreibung schreiben, Board wählen, einplanen — 30 Mal hintereinander. Bestehende Tools handhaben mehrere Accounts entweder schlecht, geraten in Pinterests aggressive Rate-Limits oder hören beim Scheduling auf, ohne tatsächlich zu publishen.
Lösung
Eine Multi-Tenant-Plattform, die mehrere Pinterest-Accounts aus einer UI orchestriert. KI-Pin-Generierung im Bulk mit drei Bild-Providern (Runware, OpenAI, Gemini) hinter einer einheitlichen Brand-Style-Abstraktion. Planung mit gleichmäßiger Verteilung gleicher URLs, exponential Backoff auf 429ern, und Publishing über Pinterest API v5 mit OAuth2-PKCE und automatischem Token-Refresh. Self-hosted Supabase auf eigener Infrastruktur — volle Datenkontrolle ohne Per-Row-Pricing.
Ergebnisse
✓Multi-Account-Architektur produktionsvalidiert
✓Drei Bild-Provider hinter einer Brand-Style-Abstraktion austauschbar
✓Rate-Limit-Tracking pro Account mit Auto-Pause unter Schwellwert
✓OAuth2 PKCE mit verschlüsselter Token-Speicherung und Refresh-Cron
✓End-to-End: Extraktion, Generierung, Validierung, Scheduling, Publishing, Reconciliation
✓250+ Commits, 63 API-Routen, 15 User-facing Pages
Eingesetzte Technologien: Next.js · TypeScript · Pinterest API v5 · OAuth 2.0 PKCE · Self-hosted Supabase · PostgreSQL · Runware · OpenAI · Gemini · n8n · Sharp · Satori
Content-Pipeline
Multi-Site KI-Content-Pipeline für WordPress
End-to-End Content-Engine: ein Keyword wird zu vier SEO-optimierten Listicle-Artikeln für vier WordPress-Sites — mit eindeutigen Titeln, Heading-Variationen, KI-generierten Bildern und Direkt-Publish über die WP REST API. Bulk-Mode kettet 100+ Artikel sequenziell.
Herausforderung
Content-Teams mit mehreren Nischen-WordPress-Sites haben dasselbe Problem: jede Site braucht eigene Artikel zu denselben Keywords, aber vier Versionen von 'Top 10 Wohnzimmer-Ideen' händisch zu schreiben ist brutal. Bestehende KI-Tools liefern entweder Duplicate Content (Google straft ab), übersehen die visuelle Suchintent-Ebene, oder hören beim Draft auf — jemand muss am Ende manuell in WordPress kopieren.
Lösung
Eine Pipeline mit vier Phasen: Intent-Klassifikation, Pinterest-Vision-Analyse via DataForSEO-Screenshot, strukturierte Keyword-Anreicherung über einen eigenen Pinspector-Service, finale Curation. Eindeutige Heading-Varianten pro Site verhindern Duplicate-Content. Asynchrone Bild-Pipeline über Runware mit Webhook-Callbacks. Publishing als native Gutenberg-Blöcke direkt über die WP REST API. Bulk-Mode kettet 100+ Artikel sequenziell, der Browser kann mittendrin geschlossen werden.
Ergebnisse
✓Vier-Phasen-Outline-Pipeline mit Graceful Degradation bei Provider-Ausfällen
✓Multi-Site, Multi-Language (sieben Locales), Multi-Template
✓Asynchrone Bild-Pipeline mit Webhook-Callbacks und automatischer Alt-Text-Generierung
✓Native Gutenberg-Block-Output — kein Editor-Bruch
✓Self-chaining Bulk-Pipeline für 100+ Artikel pro Job
✓270+ Commits, 77 API-Routen, 22 User-facing Pages
Eingesetzte Technologien: Next.js 14 · TypeScript · PostgreSQL · Prisma · OpenAI GPT-4.1 · Runware · DataForSEO · WordPress REST API · Upstash QStash
KI-gestütztes Content-Portal
KI-Rezeptportal mit nativer Pinterest-Distribution
Live, monetarisiertes Rezeptportal: Editor chattet mit einem KI-Assistenten, der per Function Calling Bestand durchsucht, Duplikate prüft, Ideen generiert und veröffentlichungsreife Rezepte mit Foodfotografie-Bildern und Pinterest-Pins ausliefert.
Herausforderung
Eine Content-Site solo zu betreiben ist eine Tretmühle. Jedes Rezept braucht Recherche (existiert es schon?), strukturierte Daten (Schema.org Recipe für Rich Snippets), AdSense-freundliches Markup, gebrandete Pinterest-Pins und eine schnelle, performante Public-Site. Die meisten CMS geben dir den Editor und das war's — der Operator klebt einen Stack aus separaten KI-Tools, Bildservices und Pin-Generatoren manuell zusammen.
Lösung
Ein Live-Portal, in dem der Editor mit einem eingebauten KI-Assistenten chattet — Function Calling lässt den Assistenten suchen, prüfen, Ideen generieren und das fertige Rezept anlegen. Ideogram für Foodfotografie-Bilder, Sharp und Satori für gebrandete Pinterest-Pins, ISR mit React Cache für read-heavy Public-Pages, vollständiges Schema.org-Markup, Geo-Blocking und Bot-Detection im Middleware-Layer, AdSense produktiv eingebunden, self-hosted Plausible für privacy-friendly Analytics.
Ergebnisse
✓AI-as-Co-Author über Chat statt Formular — Function Calling erstellt fertige Rezepte
✓Automatische Pinterest-Pin-Generierung pro Rezept (Satori SVG → Sharp PNG)
✓Schema.org Recipe + BreadcrumbList + Organization Markup für Rich Results
✓ISR + React Cache — Recipe-Pages kosten beim Ausliefern fast nichts
✓Self-hosted Plausible Analytics + AdSense produktiv
✓230+ Commits, 47 API-Routen, 26 User-facing Pages
Eingesetzte Technologien: Next.js 14 · TypeScript · OpenAI GPT-4.1 · Function Calling · Ideogram · Sharp · Satori · Supabase · Schema.org · Plausible Analytics
KI-Agent-Infrastruktur
AI-Agent Operations Stack — Production-Engineering vom Telefon
Self-hosted KI-Agent-Stack: Claude Code läuft 24/7 auf einem eigenen Server mit 25+ produktiven Repos, persistentem Memory über Sessions, geplanten Cron-Pipelines und einem Telegram-Interface, über das Befehle und Production-Fixes von jedem Telefon aus möglich sind.
Herausforderung
Engineering-Operations skalieren nicht durch mehr Menschen, sondern durch Hebel pro Engineer. Das aktuelle Problem: KI-Agenten wie Claude Code sind mächtig, aber sie produktiv zu betreiben braucht eine Stack, die out-of-the-box nicht existiert — persistentes Memory über Sessions, geplante Jobs, ein Weg vom Telefon Production-Fixes zu deployen, sauberer Secrets-Umgang ohne Leaks, und ein Audit-Trail, der wirklich grep-bar ist. Die meisten Teams geben nach einer Woche auf oder enden mit einem Frankenstein aus Bash-Scripts.
Lösung
Eine production-grade KI-Engineering-Operations-Plattform. Claude Code läuft 24/7 auf einem self-hosted VPS mit 25+ produktiven Repos. Eine eigens entwickelte Telegram-Bridge erlaubt Befehle, Progress-Updates und Production-Fixes von überall — derselbe Conversation-Kontext am Schreibtisch oder unterwegs. Ein persistenter Memory-Layer (Supabase-backed, Haiku-summarized) gibt dem Agenten Kontinuität über Sessions. 15+ Cron-Pipelines liefern tägliche Reports, Vercel-Error-Webhooks landen mit Severity-Tagging direkt im Chat, ein Watchdog hält den Agenten auch bei Crashes am Leben. Open-source Telegram-Bridge auf MIT-Lizenz.
Ergebnisse
✓25+ produktive Repos auf einem Server, alle git-pull-ready
✓15+ aktive Cron-Pipelines (Reports, Monitoring, Sync, Watchdog)
✓Drei-Tier-Memory-Suche: Quick-Summaries → Detail-Digests → volle Session-Logs
✓Watchdog mit tmux-Heartbeat — Auto-Restart bei Agent-Crash
✓Vercel-Error-Webhook → Severity-Tagging → Telegram-Alert mit One-Tap-Kontext
✓Open-Source Telegram-Bridge (MIT) als verifizierbarer Beleg
Eingesetzte Technologien: Claude Code · Anthropic Claude API · Self-hosted Supabase · PostgreSQL · Custom Telegram Bot · Cron + tmux · Hetzner VPS · Plausible Analytics · n8n · fail2ban