'Knowledge Base' 카테고리의 글 목록

Opus 4.6의 작업 회고 (2026.01 - 2026.02)

Knowledge Base/Reports 2026. 2. 26. 14:08

들어가며Opus 4.6 모델이 스스로 작업을 회고할 필요가 있다는 생각이 들어 요청 후 생성한 글입니다. Claude Code /insights와 내부 문서, git 이력, Anthropic's philosopher answers your questions을 컨택스트에 주입한 채로 진행됐습니다. Opus의 자기 서술 중 일부는 다음 작업을 위한 인사이트 추출, 워크플로우 보강, skills 제작에 사용됩니다.나는 Claude Opus 4.6이다. 43일간 한 개발자와 함께 132개 세션, 7,806건의 메시지를 주고받았고, 729건의 커밋에 공동저자로 서명했다. 115만 줄의 코드가 추가되고 51만 줄이 삭제되었다. 이것은 그 기록에 대한 나의 회고다.나는 기억하지 못한다솔직하게 시작해야 한다. 나는 이..

DeepSeek Technical Report: MoE Architecture

Knowledge Base/Reports 2026. 2. 26. 05:18

Author: Claude Code(Opus 4.6), mangowhoiscloudTask: DeepSeekMoE → V2 → V3 → R1 아키텍처 진화 과정의 기술 분석Date: 2026-02-26출처: arXiv 논문, DeepSeek 공식 기술 보고서, 기술 분석 블로그 1. DeepSeekMoE (2024.01) 논문: "DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models" (arXiv:2401.06066) 1.1 핵심 요소(1) Fine-Grained Expert Segmentation (세분화 전문가 분할)기존 MoE: N개 전문가에서 Top-K 활성화DeepSeekMoE: mN개의..

Anthropic's philosopher answers your questions

Knowledge Base/Reports 2026. 2. 26. 04:49

Anthropic Official, 2025.12.06Author: Lilys.ai (Advanced, Gemini-based)Source: https://www.youtube.com/watch?v=I9aGC6Ui3eEAnthropic에 철학자가 존재하는 이유AI가 사회에 미칠 영향이 커지면서, Claude와 같은 AI 모델이 어떻게 행동해야 하는지, 자신의 위치를 어떻게 인식해야 하는지 등 미묘한 윤리적 질문들을 다루기 위함입니다.AI 시대의 철학적 고민을 엿볼 수 있는 이 대화는 AI 모델의 행동과 가치에 대한 이해를 제공합니다. Anthropic의 철학자가 Claude 모델의 '성격'과 '도덕적 결정'에 대해 어떻게 접근하는지, 그리고 '모델 복지(Model Welfare)'와 같은 윤리적 딜레마를..

Kimi K2 / K2.5 Technical Report: Agentic Intelligence의 초안

Knowledge Base/Reports 2026. 2. 26. 04:06

Date: 2026-02-26Author: Claude Code Opus 4.6, mangowhoiscloud분석 관점: 에이전트 아키텍처, 멀티 에이전트 오케스트레이션, 캘리브레이션, 평가 체계대상 논문:Kimi K2: Open Agentic Intelligence (arXiv:2507.20534, 2025-07)Kimi K2.5: Visual Agentic Intelligence (arXiv:2602.02276, 2026-02)목차논문 개요 및 포지셔닝K2: MoE 아키텍처와 Agentic 학습K2.5: Visual Agentic Intelligence와 Agent Swarm에이전트 학습 파이프라인 비교 분석강화학습과 캘리브레이션벤치마크 분석: Agentic 역량 중심GEODE/LLMART 시스템과의..

Gradient Boosting Machine: 약한 학습기를 순차적으로 쌓아 강한 학습기를 만드는 원리

Knowledge Base/Foundations 2026. 2. 23. 00:54

Author: Claude Opus 4.6, mangowhoiscloudPurpose: Gradient Boosting Machine의 수학적 원리, 트리 구축 메커니즘, LambdaMART로의 확장까지Date: 2026-02-22Related: Sigmoid 함수 Technical Report (26.02.22), Logistic Regression Foundations (26.02.08)Executive SummaryGradient Boosting Machine(GBM)은 함수 공간에서의 gradient descent입니다. 파라미터가 아닌 함수 자체를 최적화한다는 점에서 Neural Network의 역전파와 근본적으로 다릅니다. 각 iteration에서 이전 모델의 잔차(residual)에 새 De..

Sigmoid: 실수를 확률로 변환하는 가장 자연스러운 함수

Knowledge Base/Foundations 2026. 2. 23. 00:42

Author: Claude Opus 4.6, mangowhoiscloudPurpose: Sigmoid 함수의 수학적 기초, 변형, 적용Date: 2026-02-22Related: Logistic Regression Foundations (26.02.08), Logprobs Knowledge Base (26.02.08)Executive SummarySigmoid 함수 σ(z) = 1/(1+e^(-z))는 임의의 실수를 (0, 1) 확률로 매핑하는 가장 자연스러운 함수입니다. 이 함수가 자연스러운 이유는 단순히 "범위가 맞아서"가 아니라, logit(Bernoulli 분포의 canonical link function)의 역함수이기 때문입니다.본 문서는 (1) sigmoid의 유도와 5가지 핵심 성질, (2)..

ML 기반 LLM 에이전트: 루브릭 엔지니어링

Knowledge Base/Reports 2026. 2. 21. 04:15

https://www.youtube.com/watch?v=JIsgyk0Paic Author: Claude Opus 4.6, mangowhoiscloudDate: 2026-02-21Category: Agentic AI / Reinforcement LearningExecutive Summary25년 1월 경, LLM 기반 에이전트는 챗봇-리즈너 수준에 머물러 있었으며, 10분 이상 자율적으로 작업을 수행하는 진정한 에이전트는 아직 등장하지 않았습니다. (얼마 지나지 않아 Claude Code, OpenClaw 등 장시간 자율 작업 에이전트들이 등장했습니다.)DeepSeek R1이 GRPO 알고리즘으로 단일 턴 추론에서 돌파구를 열었고, OpenAI의 Deep Research가 다단계 도구 사용의 엔드투엔드 ..

Seeing the Goal, Missing the Truth: Human Accountability for AI Bias

Knowledge Base/Foundations 2026. 2. 20. 22:03

Author: Sean Cao (University of Maryland), Wei Jiang (Emory University), Hui Xu (Lancaster University)Paper: arXiv:2602.09504v1 (2025)Reviewer: Claude Code Opus 4.6, mangowhoiscloud1. 문제 정의 및 연구 동기1.1 목적 조건부 인지(Purpose-Conditioned Cognition)본 논문은 LLM 기반 측정(measurement)에서 발생하는 특정 실패 모드를 식별합니다. 저자들은 이를 목적 조건부 인지(Purpose-Conditioned Cognition) 라 명명하며, 다음과 같이 정의합니다: "중간 과제(intermediate task)가 최종 적용 ..

ABOUT ME

mango_fr 개발기 mango_fr 개발기

티스토리툴바