Einführung in CodeCourier

Erfahren Sie, was CodeCourier ist, wie es KI-Coding-Agenten in isolierten Cloud-Sandboxes orchestriert und wie seine Architektur skalierbare, automatisierte Entwicklungs-Workflows ermöglicht.

8 min Lesezeit
introductionoverviewgetting-started

CodeCourier ist eine KI-Workflow-Orchestrierungsplattform, mit der Entwicklungs-Teams KI-Coding-Agenten - Claude Code, OpenCode, Codex, Pi und andere - innerhalb isolierter E2B-Cloud-Sandboxes ausführen können. Statt KI-Assistenten auf Ihrem lokalen Rechner zu betreiben, stellt CodeCourier bedarfsorientiert vollständige Linux-Umgebungen bereit, führt mehrstufige Entwicklungs-Workflows aus und erfasst das institutionelle Wissen, das Ihre Agenten dabei produzieren.

Ob Sie eine einzelne Sandbox benötigen, um ein Feature zu prototypisieren, eine Design-und-Review-Pipeline mit mehreren Iterationen, einen voll automatisierten Sprint, der einen Projektplan in Pull Requests umwandelt, oder eine wiederkehrende geplante Aufgabe, die im Takt Ihres Teams läuft - CodeCourier bietet Ihnen eine einzige Control Plane, um alles zu verwalten.

Warum CodeCourier

Das lokale Ausführen von KI-Coding-Agenten erzeugt eine Reihe praktischer Probleme: Umgebungen driften zwischen Rechnern auseinander, langlaufende Aufgaben blockieren Ihre Workstation, Secrets gelangen in lokale Shells, und es gibt keine geteilte Aufzeichnung dessen, was der Agent gemacht oder gelernt hat. CodeCourier adressiert jedes dieser Probleme, indem es die Agenten-Ausführung in die Cloud verlagert und mit einer strukturierten Workflow-Schicht umhüllt.

  • Isolation - Jede Sandbox ist eine wegwerfbare Linux-VM, die von E2B betrieben wird. Agenten können Pakete installieren, Dateien ändern und beliebige Befehle ausführen, ohne Ihren Rechner oder andere Projekte zu berühren.
  • Reproduzierbarkeit - Sandbox-Templates definieren das Basis-Image, installierte Tools und vorkonfigurierte CLI-Clients. Jeder Lauf startet aus einem bekannten Zustand, ergänzt durch die Kontexte und freigegebenen Learnings Ihres Projekts.
  • Observability - Jede Nachricht, die zwischen der Plattform und dem Agenten ausgetauscht wird, wird in Echtzeit gespeichert. Sie können das gesamte Gespräch durchsehen, schrittweise Urteile von Checker-Agenten prüfen, Qualitätsbewertungen für jeden Lauf-Schritt einsehen, den Status der CI-Checks verfolgen und Kosten sowie Token-Nutzung bis hinunter zum einzelnen Lauf-Schritt nachvollziehen.
  • Wissenserfassung - Wenn ein Agent eine Stolperfalle, ein Muster oder eine Vorliebe entdeckt, extrahiert CodeCourier dies in einen strukturierten Learning-Datensatz. Freigegebene Learnings werden in Markdown kompiliert und automatisch in zukünftige Sessions eingespeist, sodass Ihre Agenten mit der Zeit klüger werden.
  • Team-Zusammenarbeit - Projekte unterstützen Owner-, Admin- und Member-Rollen. Teammitglieder teilen sich Workflows, Personas, Kontexte, Assets und Learnings innerhalb eines Projekts und behalten dabei ihre eigenen API-Key-Konfigurationen.

Kernfunktionen

Projekte

Ein Projekt ist der oberste Workspace in CodeCourier. Es ordnet jede andere Ressource - Sandboxes, Workflows, Personas, Kontexte, Assets, Pläne, Learnings, Issues und Teammitglieder - einem einzelnen Kontext zu. Projekte werden durch einen eindeutigen Slug identifiziert und können optional mit einem GitHub-Repository für Branch-Verwaltung und PR-Erstellung verknüpft werden.

Sandboxes

Sandboxes sind isolierte Linux-Umgebungen, die über E2B bereitgestellt werden. Jede Sandbox hat ein konfigurierbares Template (das das vorinstallierte CLI-Tool wie Claude Code oder OpenCode bestimmt), eine Speicherzuweisung von 256 MB bis 8 GB, eine CPU-Anzahl von 1 bis 8 Kernen und ein Timeout von 1 Minute bis 4 Stunden. Sandboxes können manuell für interaktive Erkundung erstellt oder automatisch als Teil eines Workflow-Laufs gestartet werden.

Workflows

Workflows definieren wiederholbare, mehrstufige KI-Prozesse. CodeCourier unterstützt vier Workflow-Typen:

  • Single Designer - Ein einzelner Agent führt den Prompt in einem Durchgang aus.
  • Designer & Checker - Ein Designer-Agent schreibt Code, dann überprüft ihn ein Checker-Agent. Wenn der Checker ablehnt, iteriert der Designer. Diese Schleife setzt sich bis zu einer konfigurierbaren maximalen Iterationsanzahl fort.
  • Custom Pipeline - Definieren Sie eine beliebige Abfolge von Schritt-Typen (designer, checker, optimizer, prompter, investigator, evaluator, judge) mit optionalen Schleifen und Modell-Overrides pro Schritt.
  • Persona Pipeline - Verketten Sie benannte Personas, jede mit eigenen Anweisungen, Skill-Sets und Modell-Konfiguration, zu einer sequenziellen Pipeline.

Personas

Personas sind wiederverwendbare KI-Agent-Konfigurationen, die auf ein Projekt beschränkt sind. Jede Persona hat einen Typ (designer, checker, optimizer, prompter, investigator, planner, deep-dive, reviewer oder custom), ein optionales Modell-Override, ein Thinking-Effort-Level, eigene Anweisungen und Sets aktivierter Skills, Commands und Scripts. Personas erlauben es Ihnen zu standardisieren, wie Agenten sich über Läufe hinweg verhalten - eine Persona „Security Reviewer“ könnte beispielsweise hohen Thinking-Effort mit bestimmten sicherheitsfokussierten Skills aktivieren und gezielte Commands für statische Analyse nutzen.

Kontexte

Kontexte sind wiederverwendbare, versionierte System-Prompt- und CLAUDE.md-Dokumente, die an bestimmte Session-Typen innerhalb eines Projekts gebunden werden können. Anstatt einen einzigen globalen System-Prompt zu pflegen, können Sie unterschiedliche Kontext-Dokumente für jeden Session-Typ erstellen - eins für Issue-Scanning-Sessions, ein anderes für Learning-Sessions, ein weiteres für Merge-Operationen - und sie unabhängig voneinander aktualisieren, während sich Ihr Projekt entwickelt. Jedes Kontext-Dokument ist versioniert, sodass Sie verfolgen können, wie sich Ihre Agenten-Anweisungen im Laufe der Zeit ändern, und bei Bedarf zurückrollen können.

Assets: Skills, Commands und Scripts

Assets sind unabhängig versionierte, veröffentlichbare Pakete, die das Agenten-Verhalten in der Sandbox erweitern. Es gibt drei Asset-Typen:

  • Skills- Domänenspezifische Wissenspakete, die aus einer oder mehreren Dateien bestehen (z. B. könnte ein Convex-Patterns-Skill eine Referenz-Datei, Code-Snippets und Architektur-Richtlinien enthalten). Skills werden in das Sandbox-Dateisystem geschrieben und im Kontext des Agenten referenziert.
  • Commands - Shell-Befehl-Aliase, die Agenten innerhalb der Sandbox aufrufen können. Commands standardisieren gängige Operationen wie Tests, Linting oder das Aufrufen projektspezifischer Werkzeuge.
  • Scripts - Ausführbare Skripte, die zu bestimmten Zeitpunkten in einem Workflow innerhalb der Sandbox ausgeführt werden können. Skripte sind nützlich für Pre-Run-Setup, Post-Run-Teardown oder das Einspeisen dynamischer Kontexte in Agent-Sessions.

Alle Asset-Typen sind pro Persona und pro Session-Typ auswählbar und geben Ihnen feingranulare Kontrolle darüber, welche Fähigkeiten jede Agenten-Rolle hat.

Issues

Issue-Sessions ermöglichen es Ihnen, eine Codebasis auf Bugs, technische Schulden oder Verbesserungsmöglichkeiten zu scannen. CodeCourier analysiert das Repository und generiert strukturierte Issues mit Titeln, Beschreibungen, Prioritäten und vorgeschlagenen Prompts. Wenn eine Issue-Session Fragen oder Annahmen produziert, die einer Klärung bedürfen, lässt eine Answering Sessionden KI-Agenten diese Fragen vor der Implementierung auflösen. Issues können dann einzeln ausgeführt oder zu Work Chains oder Sprint Chains gruppiert werden.

Sprint Chains

Sprint Chains sind Batch-Orchestrierungs-Pipelines, die mehrere Workflow-Läufe über Branches hinweg in Folge ausführen. Im Gegensatz zu Work Chains (die eine Liste von Issues gegen einen einzelnen Branch abarbeiten) definieren Sprint Chains einen Bereich von Sprints, verfolgen einen aktuellen Sprint-Index und führen pro Sprint ein eigenes PR-Tracking. Sprint Chains eignen sich ideal zum Ausführen einer geplanten Roadmap von Features oder Fixes, bei denen jeder Sprint seinen eigenen PR erzeugt.

Wiederkehrende Aufgaben

Mit wiederkehrenden Aufgaben können Sie jeden Workflow planen, damit er automatisch nach einem wiederkehrenden Zeitplan ausgeführt wird. Sie konfigurieren die Frequenz (täglich, jeden zweiten Tag, wöchentlich, zweiwöchentlich oder monatlich), die Zeitzone und die Stunde und Minute der Ausführung. CodeCourier verfolgt die nächste geplante Ausführungszeit und stößt sie automatisch an. Wiederkehrende Aufgaben sind nützlich für nächtliche Testläufe, wöchentliche Abhängigkeits-Audits oder jeden anderen sich wiederholenden Workflow, den Ihr Team automatisieren möchte.

Learnings

Learnings erfassen institutionelles Wissen aus Agent-Sessions. Jeder Learning-Datensatz enthält eine Beschreibung, eine Auslösebedingung, das korrekte Verhalten, einen Schweregrad (critical, important oder minor) und eine Kategorie (preference, pattern, gotcha, tool oder architecture). Learnings durchlaufen einen Review-Workflow - pending, approved oder rejected - und freigegebene Learnings werden versioniert und in Markdown kompiliert, das automatisch in zukünftige Sandbox-Prompts aufgenommen wird.

Qualitätsbewertung

Jeder Lauf-Schritt enthält eine strukturierte Qualitätsbewertung, die die Ausgabe des Agenten über sechs Dimensionen bewertet: Korrektheit, Typsicherheit, Code-Stil, Testabdeckung, Vollständigkeit und einen Gesamtwert, der diese aggregiert. Läufe verfolgen einen Gesamtqualitätswert, der aus ihren Schritten abgeleitet wird. Qualitätsbewertungen ermöglichen es Teams, die Output-Qualität über die Zeit zu überwachen und zu identifizieren, welche Workflow-Konfigurationen die besten Ergebnisse liefern.

CI-Checks

Läufe verfolgen den CI-Check-Status über ein ciChecks-Objekt, das den Gesamtstatus, das Array einzelner Check-Ergebnisse und den Zeitpunkt der letzten Abfrage erfasst. Dies gibt Ihnen einen Live-Einblick, ob agenten-generierter Code Ihre CI-Pipeline besteht, ohne dass Sie die CodeCourier-Oberfläche verlassen müssen.

So funktioniert es

Der typische Ablauf in CodeCourier folgt diesem Pfad:

  1. Projekt konfigurieren - Erstellen Sie ein Projekt, verknüpfen Sie Ihr GitHub-Repository, fügen Sie API-Keys für E2B, Anthropic (oder OpenRouter / OpenAI) und GitHub hinzu und laden Sie Ihr Team ein.
  2. Kontexte und Assets einrichten - Definieren Sie Kontext-Dokumente für jeden Session-Typ (issues, learning, merging, answering, evaluating, judging) und erstellen Sie Skill-, Command- und Script-Assets, die Agenten nutzen werden.
  3. Personas und Workflows definieren - Richten Sie die Agenten-Persönlichkeiten ein, die Sie benötigen (ein schneller Designer, ein gründlicher Checker, ein Qualitäts-Evaluator) und erstellen Sie Workflow-Blueprints, die sie miteinander verketten.
  4. Ausführen - Lösen Sie einen Lauf aus einem Workflow, einem Issue oder einem Zeitplan einer wiederkehrenden Aufgabe aus. CodeCourier startet einen Hintergrund-Job über Trigger.dev, der eine E2B-Sandbox bereitstellt, das konfigurierte CLI-Tool installiert und ihm Ihren Prompt zusammen mit dem aktiven Kontext-Dokument und allen kompilierten Learnings übergibt.
  5. Iterieren - Für mehrstufige Workflows verwaltet die Plattform die Designer/Checker-Schleife automatisch, erstellt für jeden Schritt neue Sandbox-Sessions, zeichnet jede Nachricht in Echtzeit auf und bewertet die Output-Qualität in jedem Schritt.
  6. Liefern - Wenn der Lauf abgeschlossen ist, kann CodeCourier automatisch einen Pull Request in Ihrem verknüpften GitHub-Repository erstellen, Learnings aus der Session extrahieren und Ihr Team benachrichtigen. Der CI-Check-Status wird post-merge verfolgt.

Echtzeit standardmäßig

CodeCourier verwendet Convex als Datenbank und Backend-Runtime. Alle Daten - Sandbox-Status, Lauf-Fortschritt, Nachrichten, Qualitätsbewertungen, CI-Check-Status, Learning-Reviews - aktualisieren sich in Echtzeit über alle verbundenen Clients hinweg. Es gibt kein Polling; Änderungen erscheinen sofort.

Architekturübersicht

CodeCourier baut auf vier zentralen Diensten auf, die jeweils für eine eigene Ebene der Plattform zuständig sind:

  • Next.js-Frontend - Eine Next.js 16-Anwendung mit App Router, Server Components und Internationalisierung über next-intl. Die UI ist mit Tailwind CSS, Radix-UI-Primitives und shadcn/ui-Komponenten gebaut, mit Framer Motion für Animationen.
  • Convex-Backend - Convex stellt Datenbank, Echtzeit-Subscriptions, Server-Funktionen (Queries, Mutations, Actions) und Datei-Storage bereit. Die gesamte Geschäftslogik - Authentifizierungsprüfungen, Autorisierung, Datenvalidierung - läuft in Convex-Funktionen. Das Schema definiert Tabellen für Benutzer, Projekte, Sandboxes, Workflows, Läufe, Lauf-Schritte, Personas, Kontexte, Assets, Issues, Issue-Sessions, Learnings, wiederkehrende Aufgaben, Sprint Chains, Nutzungs-Datensätze, Benachrichtigungen und mehr.
  • E2B-Sandboxes - E2B stellt die isolierten virtuellen Linux-Maschinen bereit, in denen KI-Agenten ausgeführt werden. CodeCourier verwaltet den Sandbox-Lebenszyklus (create, pause, resume, kill) und kommuniziert über das E2B-SDK mit der Agent-CLI, die darin läuft.
  • Trigger.dev-Jobs - Trigger.dev übernimmt die Orchestrierung von Hintergrund-Jobs. Langlaufende Operationen wie Sandbox-Provisionierung, mehrstufige Workflow-Ausführung, Issue-Sessions, Sprint Chains und das Anstoßen wiederkehrender Aufgaben werden als Trigger.dev-Tasks behandelt, mit Callback-Secrets für die sichere Kommunikation zurück zu Convex.

Die Authentifizierung wird von Clerk übernommen, das OAuth, E-Mail/Passwort und Session-Verwaltung bereitstellt. Clerk-JWTs werden in Convex-Server-Funktionen verifiziert, um die Autorisierung pro Benutzer und pro Projekt durchzusetzen.

Nächste Schritte

Bereit loszulegen? Der Schnellstart-Leitfaden führt Sie in weniger als zehn Minuten durch Ihren ersten Lauf, oder steigen Sie direkt in die Kernkonzepte ein, um ein tieferes Verständnis der Bausteine der Plattform zu erlangen.