Rat der Weisen — Sicherheitsaudit
ChatGPT ✓
Gemini ✓
Claude ✓
Synthese ✓
$0.0243
ChatGPT — gpt-4o
Whitelisting erlaubter Befehle + Rate Limiting (H2, 80%) + starke Auth-Validierung (H3, 70%). Monitoring als vierte Schicht. Kernschwäche: Ohne Auth können externe Angreifer beliebige Payloads einschleusen.
Gemini — gemini-2.5-pro
API-Gateway statt subprocess eliminiert Injection an der Wurzel (H1, 90%). HMAC-Signatur für Cherry (H2, 70%). Asynchrone Queue mit Budget-Cap gegen Loop und Kosten (H3, 85%). Outlier: Human-in-the-Loop Staging als ultimative Bremse.
Claude — Anthropic
Drei minimalinvasive Massnahmen: Bearer-Token am Endpoint, Payload-Blacklist gegen OUTBOX-Referenzen, täglicher Task-Zähler. subprocess.run([…]) ohne shell=True = keine Shell-Injection. Geminis H1 ist overengineered für diesen Kontext.
M-052 Zwei-Verifier-Protokoll
Verifier A
K1 AUTHGRÜN
K2 LOOPGRÜN
K3 WILDWUCHSGRÜN
K4 WATCHERGRÜN
K5 TOKENGRÜN
K6 EXTERNGRÜN
FREIGEGEBEN
Verifier B
K1 AUTHGRÜN
K2 LOOPGRÜN
K3 LIMITGRÜN
K4 WATCHERGRÜN
K5 TOKENGRÜN
K6 PAYLOAD-GRÖSSEGRÜN
FREIGEGEBEN
Verifier B hat TTY-Problem des Watchers (input() unter launchd) identifiziert — sofort behoben: V2 Auto-Execute. Beide Verifier arbeiten blind füreinander.