Claude Code 官方技术复盘和 Harness 设计启示

本文基于 Anthropic 官方技术复盘 An update on recent Claude Code quality reports 与中文媒体分析, 从工程视角解构一次典型的 AI 产品层质量事故,并提炼对 Harness 设计的通用参考。 一、事件背景:当「最强编程模型」口碑滑坡 2026 年 3 月至 4 月期间,大量 Claude Code 用户在 Hacker News、Reddit 和 X 上反馈模型「变笨了」—— 输出变得健忘、重复、废话连篇,甚至在复杂任务中表现明显退步。 ...

2026-04-24 · 20 分钟 · 3642 字 · cjraft

Token Optimization By Caveman

最近 GitHub 看到好几个关注 token 压缩的项目, 比如 rtk、 caveman, 前者通过代理模式对 tool 输出进行自动压缩, 后者通过纯 PE 手段进行 output token 压缩。 本文仅关注 Caveman 开源项目的调研,了解其 token 压缩的方式 ...

2026-04-08 · 13 分钟 · 2301 字 · cjraft

Claude Code 源码分析一【上下文管理】

本文源自 Claude Code 的 Query Loop 实现分析,研究其上下文治理策略并从中提炼关键策略 众所周知, Claude Code 昨天开源了,对于做 Agent 的个人和团队都是一个很好的借鉴,从目前放出来的代码量看,大概体量如下(统计自 src 目录, 源码在 https://github.com/cjraft/claude-code): ...

2026-04-01 · 35 分钟 · 6219 字 · cjraft

Ralph Loop:让 AI 自己跑完全程

一句话定义:Ralph Loop 是一个"把 AI 放进 while true 里"的自主迭代开发技术——你定义终点,AI 自己跑,跑完为止。 是什么 Ralph Loop(也叫 Ralph Wiggum Loop): ...

2026-01-30 · 21 分钟 · 3764 字 · cjraft

Agent Skills:从概念到实践的技术剖析

一、前言 想象一下,你雇了一位实习生,开始时你教了一些规范: “我们公司的 PPT 要用这个颜色,这个字体,Logo 放左上角……” “代码审查要检查这些安全项,那些性能点……” ...

2025-12-07 · 32 分钟 · 5803 字 · cjraft