홈
태그
방명록

분류 전체보기 (275)

ABOUT ME

-

트위터
인스타그램

Today: -

Yesterday: -

Total: -

mango_fr 개발기 mango_fr 개발기

컨텐츠 검색

Anthropic

LLM 에이전트 평가(Evals) 가이드
Knowledge Base/Foundations 2026. 1. 31. 22:32

Author: Claude Code, mangowhoiscloudReference(26.01.19): Anthropic Engineering - Demystifying Evals for AI AgentsPurpose: 에이전트 개발을 위한 Knowledge BaseDate: 2026-01-31 Executive Summary에이전트 평가는 단순한 프롬프트-응답 테스트를 넘어, 다중 턴 상호작용, 도구 호출, 환경 상태 변화를 종합적으로 측정해야 합니다. 이 문서는 Anthropic의 에이전트 평가 방법론을 정리하고, 적용 가이드를 제시합니다. 핵심 공식:Eval = Input + Agent Execution + Grading Logic → Success Measurement1. 에이전트 평가의 기본 구조..

이전

1

다음

인기포스트

LINK

GitHub
LinkedIn
Resume

ADMIN

admin 글쓰기

ABOUT ME

🎓 부산대학교 정보컴퓨터공학과 학사: 2017.03 - 2023.08
☁️ Rakuten Symphony Jr. Cloud Engineer: 2024.12.09 - 2025.08.31
🏆 2025 AI 새싹톤 우수상 수상: 2025.10.30 - 2025.12.02
🌏 이코에코(Eco²) 백엔드/인프라 고도화 중: 2025.12 - Present

Designed by Mango

티스토리툴바