KI für Unternehmen

Entwicklung maßgeschneiderter KI-Lösungen: von der Idee zur produktiven Software

Wir verkaufen keine Lizenzen und keinen Hype. Wir bauen Agenten, RAG, Dokumentations-Pipelines und Integrationen — mit Code, Tests, Logs und Übergabe.

Beschreiben Sie Ihr Problem Zum KI-Hub

Das Problem

Unternehmen wünschen sich maßgeschneiderte KI, erhalten jedoch unrealistische Angebote: Demos in zwei Wochen ohne Integration oder Projekte über 12 Monate ohne Zwischenlieferung. Wenn die Rechnung kommt, gibt es nichts in Produktion.

Viele Anbieter verpacken OpenAI-APIs in eine ansprechende Benutzeroberfläche und nennen es „Enterprise-Lösung“. Ohne Zugang zu Ihren Systemen, ohne Berechtigungen, ohne Bewertung oder Überwachung ist es keine Entwicklung: es ist Wiederverkauf.

Internes Talent ist rar. Einen Senior ML Engineer für ein kurzfristiges Projekt einzustellen, passt nicht. Ein freiberuflicher Entwickler ohne Architektur hinterlässt ein Skript, das niemand pflegt, wenn er geht.

Klassische Software-Teams kennen nicht immer KI-Muster: Chunking, RAG-Bewertung, Tool-Calling, Kosten pro Token, Guardrails. Das Ergebnis sind fragile Integrationen, die beim ersten Nutzungsgipfel ausfallen.

Ohne klare Definition von „fertig“ — minimale Genauigkeit, Uptime, SLA-Antwortzeiten, Eigentum des Codes — ziehen sich Projekte in die Länge, und das Geschäft verliert das Vertrauen in KI als Werkzeug.

Maßgeschneiderte Entwicklung bedeutet nicht, das Modell neu zu erfinden. Es bedeutet, erprobte Komponenten — Embeddings, Agenten-Frameworks, OCR — mit Ihrer Geschäftslogik und Ihren Integrationen zusammenzustellen.

Die Wartung nach dem Launch ist real: Modelle ändern sich, APIs werden abgekündigt, das Volumen wächst. Budgetieren Sie 15–25 % jährlich der Anfangskosten für Weiterentwicklungen, nicht nur für Hosting.

Organisatorischer Wandel ist wichtig: Support, IT und Geschäft müssen sich einig sein, was automatisiert wird und was menschliches Urteil erfordert. Ohne diese Einigung erzeugt das Projekt interne Reibungen, auch wenn die Technologie funktioniert.

Vendor Lock-in bei KI-SaaS: Sie laden Dokumente hoch und können Index oder Prompts nicht exportieren. Eigenentwicklung bleibt aktiv in Ihrer Bilanz.

Interne Teams sind überlastet: externe Entwicklung mit Lieferung im Repository und Pair Programming überträgt Kapazität, keine ewige Abhängigkeit.

Code wird ohne Regressionstests in Prompts geliefert: eine kleine Änderung bricht die Extraktion in Produktion am Montag. CI für KI ist kein Luxus.

RUMAZA verkauft keine Lizenzen: wir bauen ein System, das Sie messen, warten und erweitern können. Wenn der Kern des Problems nicht mit verfügbaren Daten automatisierbar ist, sagen wir es Ihnen im ersten Meeting — das spart Monate und Budget.

Due Diligence von Anbietern: Wenn Ihr Investor oder großer Kunde eine technische Prüfung verlangt, liefern wir dokumentierte Architektur und Sicherheitspraktiken.

Horizontale Skalierung: Design, damit das Verdoppeln des Volumens nicht die Kosten linear verdoppelt, wenn Caching und intelligentes Batching vorhanden sind.

Drei Angebote ohne gemeinsame Spezifikation zu vergleichen, ist sinnlos: Umfang, Integrationen und Akzeptanzmetriken müssen identisch sein, um fundierte Entscheidungen zu treffen.

Eigentum des Codes ohne Dokumentation ist ein illiquides Asset. Wir liefern Repository, README, Diagramme und eine aufgezeichnete Übergabesitzung.

Iteration mit realen Daten der ersten zwei Wochen in Produktion: Anpassung von Schwellenwerten, Prompts und Regeln mit Metriken des Kunden, nicht Annahmen aus dem Labor.

Der Erfolg des Projekts wird im Kickoff-Meeting definiert: Basisvolumen, aktuelle Zeit pro Fall, manuelle Fehlerquote und Kosten pro Stunde — damit berechnen wir ROI, bevor wir eine Zeile Code schreiben.

Schulung beim Abschluss: Wir liefern keine Software, die nur die IT versteht. Der Geschäftsnutzer weiß, wie man nutzt, skaliert und Vorfälle mit Screenshots und realen Beispielen aus dem Alltag meldet.

Go-Live-Checkliste: Berechtigungen, Backups, Rollback, Eskalationskontakte und schriftlich vereinbarte Hypercare-Fenster — so startet die Produktion ohne Überraschungen am Wochenende.

Wenn nach der Diagnose der ROI nicht stimmt, sagen wir es Ihnen und berechnen keine Entwicklung — besser einen Verkauf verlieren als einen unzufriedenen Kunden sechs Monate später.

Die Adoptionskurve verbessert sich, wenn der erste Anwendungsfall ein universelles Problem des Teams löst — kein Innovationsversuch, den niemand angefordert hat.

Was ist die Entwicklung maßgeschneiderter KI-Lösungen (ohne Hype)

Es ist Softwareengineering, das auf Probleme angewendet wird, bei denen ein KI-Komponente — LLM, Vision, Embeddings, Klassifikation — Teil eines größeren Systems ist: Backend, APIs, Datenbank, Benutzeroberfläche, Authentifizierung, Bereitstellung und Beobachtbarkeit.

Es umfasst Prozessentdeckung, Architekturdesign, Implementierung, Integration mit ERP/CRM/Kanälen, Bewertung mit realen Daten, Bereitstellung in Ihrer Cloud oder unserer und Dokumentation, damit Ihr Team oder wir warten können.

Typische Deliverables: Agent mit Tools, RAG-Pipeline, Dokumentenextraktor, interner Copilot, Automatisierung von Workflows, eigene API, damit andere Systeme KI konsumieren.

Die gesunde Methodik ist iterativ: MVP in Wochen, Metriken in Produktion, zweite Phase je nach Daten — kein Big Bang über sechs Monate ohne Validierung.

Das geistige Eigentum des maßgeschneiderten Codes gehört Ihnen. Drittanbieter-APIs (OpenAI usw.) haben ihre Lizenzen. Das klären wir im Vertrag.

Typischer RUMAZA-Stack: Python oder TypeScript Backend, PostgreSQL, Queues, Docker, CI mit Regressionstests in kritischen Prompts. Keine Notebooks in der Produktion.

Beispiel für Akzeptanzkriterien: „≥80 % Genauigkeit bei der Extraktion des Betrags in Testrechnungen“, „p95 Latenz < 8 s“, „100 % der Abfragen protokolliert“.

Die Übergabe umfasst ein Runbook: was zu überwachen ist, wie API-Schlüssel zu rotieren sind, wie Dokumente neu indiziert werden und wer anruft, wenn der Dienst an einem Sonntag ausfällt.

Schrittweise Bereitstellung: Pilot mit einem Kanal oder einem Abfragetyp, Messung zwei Wochen, Erweiterung je nach Daten — kein Big Bang, der das Team und den Kunden überlastet.

Vertrag in Phasen mit unterzeichneten Akzeptanzkriterien: Staging, UAT mit echten Nutzern, Go-Live und Hypercare von zwei Wochen.

Beobachtbarkeit: Dashboards für Latenz, Fehlerquote, Kosten pro Abfrage und Drift der Qualität in der Extraktion oder RAG.

Dokumentation für internes IT: Diagramme, Umgebungsvariablen, Runbook und Eskalationskontakt. Vollständige Lieferung, nicht nur Zip mit Code.

RUMAZA-Kriterium: konkretes Problem, zugängliche Daten, Erfolgsmessung und geschlossener Umfang. Ohne diese vier Säulen gibt es kein Projekt — es gibt ein Experiment, das dem Berater gut und dem Kunden schlecht in Rechnung gestellt wird.

Infrastructure as Code: Terraform oder ähnliches, um Staging- und Produktionsumgebungen ohne „funktioniert auf meinem Rechner“ zu reproduzieren.

Optionaler vierteljährlicher Fahrplan: neue RAG-Quellen, Sprachen oder Connectoren je nach geschäftlicher Priorität.

Die evolutionäre Wartung — neue Intents, Anbieter, Sprachen — wird separat vom MVP budgetiert, damit es keine Überraschungen oder Zombieprojekte gibt.

Pen-Tests und Überprüfung der Angriffsfläche bei exponierten APIs, bevor sie ins Internet geöffnet werden — nicht nur Funktionalität.

Support nach dem Launch mit direktem Kanal und vereinbartem SLA: kritische Vorfälle während der Arbeitszeit werden am selben Tag gelöst — kein ewiges Ticket.

Wir dokumentieren Annahmen, bekannte Grenzen und den Erweiterungsplan bei der Lieferung — vollständige Transparenz darüber, was das System heute macht und was für eine Phase zwei bleibt, wenn die Zahlen es rechtfertigen.

Architektur, die für Erweiterungen vorbereitet ist: neue Kanäle, Sprachen oder Dokumente, ohne von Grund auf neu zu beginnen — modulare Erweiterung, kein fragiles Monolith.

Ausrichtung mit Sicherheit und Recht von der Planung an: DPIA, wenn anwendbar, Protokollierung von Verarbeitungstätigkeiten und Klauseln mit Subunternehmern von Cloud-Modellen.

Retrospektive-Meeting nach 30 und 60 Tagen: was funktioniert hat, was angepasst werden muss, ob Phase zwei sinnvoll ist — Entscheidung mit Daten, nicht durch Budgetinertie.

Wir priorisieren Deliverables, die das Geschäft in der ersten Woche bemerkt: eine gelöste Anfrage, ein verarbeiteter Dokument oder ein nützlicher Entwurf — frühe Erfolge, die das Vertrauen in den Rest des Fahrplans finanzieren.

Admin-Panel für IT: Benutzer, indizierte Quellen, Verbrauch und Alarme, ohne von externen Entwicklungstickets für jede kleine Änderung abhängig zu sein.

Wann es sinnvoll ist

Criterios

Der SaaS des Marktes passt nicht zu Ihrem Prozess oder Ihren Systemen — mit Volumen und Daten, die es rechtfertigen.
Sie benötigen eine tiefe Integration mit ERP, CRM oder Legacy — mit Volumen und Daten, die es rechtfertigen.
Datenschutzanforderungen verhindern Daten auf generischen Plattformen — mit Volumen und Daten, die es rechtfertigen.
Sie möchten Eigentum am Code und Vendor Lock-in vermeiden — mit Volumen und Daten, die es rechtfertigen.
Das Volumen rechtfertigt die Optimierung der Kosten im Vergleich zu nutzerbasierten Lösungen — mit Volumen und Daten, die es rechtfertigen.
Sie suchen einen technischen Partner, nicht nur Lizenzen — mit Volumen und Daten, die es rechtfertigen.

Was gebaut werden kann

Agenten mit Tools

Software, die APIs abfragt, Tickets erstellt, verfasst und mit Berechtigungen und Logs ausführt. Beinhaltet Logs, Vertrauensschwellen und menschliche Überprüfung in der Anfangsphase, bis Metriken in Produktion kalibriert sind.

Unternehmens-RAG-Plattform

Ingestion, Suche, Chat mit Zitaten und Verwaltungs-Panel für Quellen. Beinhaltet Logs, Vertrauensschwellen und menschliche Überprüfung in der Anfangsphase, bis Metriken in Produktion kalibriert sind.

Dokumentations-Pipelines

OCR + Extraktion + Validierung + ERP. Hohe Volumen, geringe manuelle Intervention. Beinhaltet Logs, Vertrauensschwellen und menschliche Überprüfung in der Anfangsphase, bis Metriken in Produktion kalibriert sind.

Eigene KI-API

Internes Endpoint, damit Ihr Produkt oder Ihre Abteilungen Klassifikation, Zusammenfassung oder Extraktion konsumieren können. Beinhaltet Logs, Vertrauensschwellen und menschliche Überprüfung in der Anfangsphase, bis Metriken in Produktion kalibriert sind.

Wie RUMAZA es bauen würde

Technische Discovery

Prozess, Systeme, APIs, rechtliche Einschränkungen und Volumen. Dokumentiertes und mit Ihnen überprüftes Deliverable vor dem nächsten Schritt.

Architektur und Umfang

Diagramm, Stack, Deliverables, Akzeptanzkriterien und Festpreis pro Phase. Dokumentiertes und mit Ihnen überprüftes Deliverable vor dem nächsten Schritt.

Sprint MVP

Code im Repository, grundlegendes CI, Staging-Umgebung und Bewertung mit realen Daten. Dokumentiertes und mit Ihnen überprüftes Deliverable vor dem nächsten Schritt.

Integrationen

Robuste Connectoren mit Wiederholungen, Queues und Fehlerhandling. Dokumentiertes und mit Ihnen überprüftes Deliverable vor dem nächsten Schritt.

Produktion

Deployment, Monitoring, Kosten- und Qualitätsalarme. Dokumentiertes und mit Ihnen überprüftes Deliverable vor dem nächsten Schritt.

Übergabe

Dokumentation, Schulung und Option für monatliche Wartung. Dokumentiertes und mit Ihnen überprüftes Deliverable vor dem nächsten Schritt.

Mögliche Technologien

Python
TypeScript / Next.js
Django / FastAPI
PostgreSQL + pgvector
OpenAI / Anthropic / lokale Modelle
Docker / AWS / GCP
Celery / Temporal
GitHub Actions

Anwendungsszenarien

Escenario 1

Produktidee mit KI ohne klare Architektur

Sie wollen „KI einbauen“, haben aber keine definierten Daten, Abläufe oder Metriken. Passt zu Diagnose, begrenztem MVP und Code, den sie warten oder skalieren können.

Escenario 2

Prototyp in No-Code, der nicht ausreicht

Zapier oder visuelle Tools halten den Volumen, die Berechtigungen oder die Logik nicht mehr aus. Maßgeschneiderte Entwicklung, wenn der Anwendungsfall validiert ist.

Escenario 3

KI-Integration in bestehende Software

Portal, ERP oder interne App, in der ein Modul für Klassifikation, Extraktion oder Assistenz mit aktuellen Benutzern und Rollen koexistieren muss.

Häufige Fehler

Evitar

Einstellung ohne messbare Akzeptanzkriterien
Von Tag eins kein Repository und keine Dokumentation verlangen
Abhängigkeit von einem einzigen Gründer-Freelancer ohne Kontinuität
Bewertung mit realen Daten vor der Produktion überspringen
Betriebskosten ignorieren (Tokens, Hosting, Support)
Unendliche strategische Beratung mit null Code vermischen
Das Projekt nach 90 Tagen mit realen Metriken überprüfen und anpassen oder schließen, was keinen Mehrwert bietet.

Häufige Fragen

Gehört der Code uns?

Ja, bei maßgeschneiderter Entwicklung. Repository, Lizenzen und Abhängigkeiten sind in der Lieferung dokumentiert. Das klären wir im Umfang je nach Ihren Systemen, Volumen und rechtlichen Einschränkungen — ohne generische Zahlen zu versprechen.

Arbeitet ihr mit unserem IT-Team?

Ja. Pairing, Architekturüberprüfungen und gemeinsame Sicherheitskriterien. Das klären wir im Umfang je nach Ihren Systemen, Volumen und rechtlichen Einschränkungen — ohne generische Zahlen zu versprechen.

Cloud oder On-Premise?

Beides je nach Richtlinie. Viele MVPs beginnen in einer verwalteten Cloud und migrieren bei Bedarf. Das klären wir im Umfang je nach Ihren Systemen, Volumen und rechtlichen Einschränkungen — ohne generische Zahlen zu versprechen.

Was benötigt ihr von uns?

Zugang zu APIs oder Testdaten, Geschäftsreferent 2–4 h/Woche und Feedback in Überprüfungen. Das klären wir im Umfang je nach Ihren Systemen, Volumen und rechtlichen Einschränkungen — ohne generische Zahlen zu versprechen.

Bietet ihr Wartung an?

Ja, optional monatlich: Updates, Monitoring, Anpassung von Modellen und Support. Das klären wir im Umfang je nach Ihren Systemen, Volumen und rechtlichen Einschränkungen — ohne generische Zahlen zu versprechen.

Wie wird abgerechnet?

In Phasen mit geschlossenem Umfang. Typisches MVP wird 40 % zu Beginn, 40 % bei Lieferung des Staging, 20 % bei Produktion in Rechnung gestellt. Das klären wir im Umfang je nach Ihren Systemen, Volumen und rechtlichen Einschränkungen — ohne generische Zahlen zu versprechen.

Brauchen Sie KI-Software, keine weitere Präsentation?

Beschreiben Sie mir das Problem und die beteiligten Systeme. Ich gebe Ihnen Architektur, Frist und festes Budget pro Phase zurück.