04 / AI Consulting

KI dort, wo sie wirklich verstärkt.

Wir helfen Unternehmen, LLMs so einzuführen, dass echter Wert entsteht — nicht „ein neuronales Netz für die Pressemitteilung“. Vom Prozess-Audit über die Strategie bis zu Production-Agenten, RAG-Systemen und Team-Trainings.

Wir leben täglich in Cursor, Claude, GPT, Gemini und Dutzenden Nischen-Tools. Wir wissen, wo KI Stunden spart — und wo sie nur stört. Wir helfen, die offensichtlichen Fallen zu überspringen.

2–6×

Beschleunigung bei Routinearbeit

10+

aktiv genutzte Modelle

100%

transparente Eval-Metriken

Formate

Engagement-Formate

AI-Strategie

Prozess-Audit, Opportunity Map, ROI, Roadmap für 6–12 Monate.

RAG-Systeme

Unternehmens-Wissensbasen, abgefragt über LLMs. Präzise Antworten mit Quellenangabe.

KI-Agenten

Für Support, Sales und Operations. Keine plaudernden Bots — Ausführer: Tool Use, Memory, Guardrails.

Team-Trainings

Workshops zur produktiven Arbeit mit Claude / GPT / Cursor. AI-Rituale, Prompt-Bibliotheken, Automatisierungs-Templates.

Fine-Tuning

SFT, DPO, Distillation, Qualitäts-Evaluation, sicherer Rollout. Wenn ein generelles Modell nicht mehr reicht.

Evaluation & Safety

Eval-Schleifen, Prompt-Regressionstests, Halluzinations-Monitoring, Schutz vor Prompt-Injection.

Stack

Werkzeugkasten

Wir wählen Modell und Orchestrierung passend zur Aufgabe. Offene Modelle, wenn sie stark genug sind; Frontier-Modelle, wenn die Aufgabe es verlangt.

Claude (Sonnet, Opus) · AnthropicGPT-5 / 4.1 · OpenAIGemini 2 Flash/Pro · GoogleLlama / Qwen / DeepSeek · openCursor · Claude Code · agentsLangGraph · LlamaIndexOpenAI Agents SDKPinecone · pgvector · Weaviaten8n · Make · ZapierWhisper · ElevenLabs · CartesiaReplicate · Modal · vLLMHelicone · LangSmith · Braintrust

Vorgehen

So starten wir ein Projekt

Discovery-Session

1–2 Wochen: Prozess-Audit, Opportunity Map, ROI-Schätzung. Ohne Verpflichtung weiterzumachen.

Pilotprojekt

1–2 Monate: ein realer Case (z. B. ein KI-Support-Copilot). Produktiver Launch mit Metriken.

AI-Resident

3+ Monate: langfristige Partnerschaft, Weiterentwicklung, Schulung. Wir werden Ihre KI-Abteilung.

häufige fragen

Antworten auf die wichtigsten Fragen — vorab

Wo sollte die LLM-Einführung in einem Unternehmen beginnen?

Mit einer kurzen Discovery-Session: 1–2 Wochen Prozess-Audit, Opportunity Map und ROI-Schätzung — ohne Verpflichtung weiterzumachen.

Welche Modelle nutzen Sie?

Claude (Sonnet, Opus), GPT-5 und 4.1, Gemini 2 Flash/Pro sowie offene Modelle wie Llama, Qwen und DeepSeek. Wir wählen nach Qualität, Kosten, Latenz und On-Prem-Anforderungen.

Wie unterscheidet sich RAG von Fine-Tuning?

RAG fügt relevante Dokumente zur Anfragezeit in den Prompt ein — ideal für aktuelles, häufig wechselndes Wissen. Fine-Tuning verändert die Modellgewichte — besser für Stil, Format und stabile Muster. Beide werden oft kombiniert.

Wie messen Sie KI-Qualität?

Wir bauen Eval-Schleifen: ein Datensatz realer Anfragen, automatisierte LLM-as-Judge-Tests, Regressionsprüfungen bei jedem Release und Halluzinations-Metriken. Kein „fühlt sich besser an, fertig“.

Wo könnte KI gerade Ihr Geschäft verstärken?

Eine Stunde kostenlose Beratung: Wir sehen uns Ihre Prozesse an und finden 3–5 Stellen, an denen sich LLMs in einem Quartal amortisieren.

Stunde buchenedge.company@proton.me