'Knowledge Base/Reports' 카테고리의 글 목록

Opus 4.6의 작업 회고 (2026.01 - 2026.02)

Knowledge Base/Reports 2026. 2. 26. 14:08

들어가며Opus 4.6 모델이 스스로 작업을 회고할 필요가 있다는 생각이 들어 요청 후 생성한 글입니다. Claude Code /insights와 내부 문서, git 이력, Anthropic's philosopher answers your questions을 컨택스트에 주입한 채로 진행됐습니다. Opus의 자기 서술 중 일부는 다음 작업을 위한 인사이트 추출, 워크플로우 보강, skills 제작에 사용됩니다.나는 Claude Opus 4.6이다. 43일간 한 개발자와 함께 132개 세션, 7,806건의 메시지를 주고받았고, 729건의 커밋에 공동저자로 서명했다. 115만 줄의 코드가 추가되고 51만 줄이 삭제되었다. 이것은 그 기록에 대한 나의 회고다.나는 기억하지 못한다솔직하게 시작해야 한다. 나는 이..

DeepSeek Technical Report: MoE Architecture

Knowledge Base/Reports 2026. 2. 26. 05:18

Author: Claude Code(Opus 4.6), mangowhoiscloudTask: DeepSeekMoE → V2 → V3 → R1 아키텍처 진화 과정의 기술 분석Date: 2026-02-26출처: arXiv 논문, DeepSeek 공식 기술 보고서, 기술 분석 블로그 1. DeepSeekMoE (2024.01) 논문: "DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models" (arXiv:2401.06066) 1.1 핵심 요소(1) Fine-Grained Expert Segmentation (세분화 전문가 분할)기존 MoE: N개 전문가에서 Top-K 활성화DeepSeekMoE: mN개의..

Anthropic's philosopher answers your questions

Knowledge Base/Reports 2026. 2. 26. 04:49

Anthropic Official, 2025.12.06Author: Lilys.ai (Advanced, Gemini-based)Source: https://www.youtube.com/watch?v=I9aGC6Ui3eEAnthropic에 철학자가 존재하는 이유AI가 사회에 미칠 영향이 커지면서, Claude와 같은 AI 모델이 어떻게 행동해야 하는지, 자신의 위치를 어떻게 인식해야 하는지 등 미묘한 윤리적 질문들을 다루기 위함입니다.AI 시대의 철학적 고민을 엿볼 수 있는 이 대화는 AI 모델의 행동과 가치에 대한 이해를 제공합니다. Anthropic의 철학자가 Claude 모델의 '성격'과 '도덕적 결정'에 대해 어떻게 접근하는지, 그리고 '모델 복지(Model Welfare)'와 같은 윤리적 딜레마를..

Kimi K2 / K2.5 Technical Report: Agentic Intelligence의 초안

Knowledge Base/Reports 2026. 2. 26. 04:06

Date: 2026-02-26Author: Claude Code Opus 4.6, mangowhoiscloud분석 관점: 에이전트 아키텍처, 멀티 에이전트 오케스트레이션, 캘리브레이션, 평가 체계대상 논문:Kimi K2: Open Agentic Intelligence (arXiv:2507.20534, 2025-07)Kimi K2.5: Visual Agentic Intelligence (arXiv:2602.02276, 2026-02)목차논문 개요 및 포지셔닝K2: MoE 아키텍처와 Agentic 학습K2.5: Visual Agentic Intelligence와 Agent Swarm에이전트 학습 파이프라인 비교 분석강화학습과 캘리브레이션벤치마크 분석: Agentic 역량 중심GEODE/LLMART 시스템과의..

ML 기반 LLM 에이전트: 루브릭 엔지니어링

Knowledge Base/Reports 2026. 2. 21. 04:15

https://www.youtube.com/watch?v=JIsgyk0Paic Author: Claude Opus 4.6, mangowhoiscloudDate: 2026-02-21Category: Agentic AI / Reinforcement LearningExecutive Summary25년 1월 경, LLM 기반 에이전트는 챗봇-리즈너 수준에 머물러 있었으며, 10분 이상 자율적으로 작업을 수행하는 진정한 에이전트는 아직 등장하지 않았습니다. (얼마 지나지 않아 Claude Code, OpenClaw 등 장시간 자율 작업 에이전트들이 등장했습니다.)DeepSeek R1이 GRPO 알고리즘으로 단일 턴 추론에서 돌파구를 열었고, OpenAI의 Deep Research가 다단계 도구 사용의 엔드투엔드 ..

LLM-as-Judge: Cohen's Kappa의 해상도 함정, 4-cat으로 일관성이 올랐다는 착각

Knowledge Base/Reports 2026. 2. 20. 16:33

Author: Claude Code Opus 4.6, mangowhoiscloudDate: 2026-02-20Category: Evaluation Methodology / Statistical RigorExecutive SummaryLLM-as-Judge, 평가, 어노테이션 파이프라인에서 "평가 카테고리를 줄이면 Cohen's Kappa가 올라간다"는 설계 관행이 널리 퍼져 있습니다. 본 포스팅에서는 연속 스케일 [1.0, 5.0, step=0.1] (41단계)을 4-범주로 축소할 때 Unweighted Cohen's Kappa가 +0.19~+0.64 상승하는 것을 시뮬레이션으로 확인하되, 이 수치 상승의 상당 부분이 명목 척도 지표를 순서형 데이터에 적용할 때 발생하는 측정론적 허상(measuremen..

Cursor state.vscdb 16GB 분석 리포트

Knowledge Base/Reports 2026. 1. 15. 06:50

작성일자: 2025.01.15AI Coding Agent의 상태 관리 및 컨텍스트 영속화에 대한 기술 분석1. 문제 현황측정 결과/Users/mango/Library/Application Support/Cursor/User/globalStorage/├── state.vscdb → 9.2GB├── state.vscdb.backup → 7.1GB├── state.vscdb-wal → 11MB└── state.vscdb-shm → 32KB ───────── Total: ~16.3GB전체 디스크 사용량위치용량비고Cursor (state.vscdb)16.3GB🔥 주범Notion10GB Library/..

ABOUT ME

mango_fr 개발기 mango_fr 개발기

티스토리툴바