eval-harness
[ Empfohlen ]Eval Harness ist ein Bewertungsframework für Claude Code-Sitzungen, das die Messung der Zuverlässigkeit und Leistung von KI-Agents ermöglicht
★ 171.1k
⑂ 0
Durchsuchen und installieren Sie Tausende KI-Agenten-Skills im Killer-Skills-Verzeichnis. Unterstützt Claude Code, Windsurf, Cursor und mehr.
Eval Harness ist ein Bewertungsframework für Claude Code-Sitzungen, das die Messung der Zuverlässigkeit und Leistung von KI-Agents ermöglicht
Die Verifizierungsschleife ist ein System, das die Qualität der Claude-Code-Sitzungen durch Verifizierungsphasen überprüft