evaluation
AIエージェント評価フレームワークは、AIエージェントシステムの性能を評価するための構造です
Killer-Skillsディレクトリで数千のAI Agentスキルを探索・インストール。Claude Code、Windsurf、Cursorなどに対応。
This directory brings installable AI Agent skills into one place so you can filter by search, category, topic, and official source, then install them directly into Claude Code, Cursor, Windsurf, and other supported environments.
AIエージェント評価フレームワークは、AIエージェントシステムの性能を評価するための構造です
ローカライズされた概要: Create new scientific tools for ToolUniverse framework with proper structure, validation, and testing. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
ローカライズされた概要: Build slide decks and presentations for research talks using Nano Banana Pro AI. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
ローカライズされた概要: Apply relevant best practices and validate outcomes. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
ローカライズされた概要: Evaluate LLM systems using automated metrics, LLM-as-judge, and benchmarks. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
MCP Builderは、AIエージェントのサーバー構築を支援するツールであり、AIシステムと外部ツールやデータソースの接続を実現する
ローカライズされた概要: Analyzes web performance using Chrome DevTools MCP. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
ローカライズされた概要: Overcome LLM knowledge cutoffs with real-time developer content. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
ローカライズされた概要: Control Chrome browser via CLI for testing, automation, and debugging. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
FastMCP開発は、FastMCPフレームワークを使用してModel Context Protocol(MCP)サーバーを作成または変更するプロセス
ローカライズされた概要: Use telnet to interact with IoT device shells for pentesting operations including device enumeration, vulnerability discovery, credential testing, and post-exploitation. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.
ローカライズされた概要: # Project Development Methodology This skill covers the principles for identifying tasks suited to LLM processing, designing effective project architectures, and iterating rapidly using agent-assisted development. This AI agent skill supports Claude Code, Cursor, and Windsurf workflows.