Claude Code 官方技术复盘和 Harness 设计启示

本文基于 Anthropic 官方技术复盘 An update on recent Claude Code quality reports 与中文媒体分析, 从工程视角解构一次典型的 AI 产品层质量事故,并提炼对 Harness 设计的通用参考。 一、事件背景:当「最强编程模型」口碑滑坡 2026 年 3 月至 4 月期间,大量 Claude Code 用户在 Hacker News、Reddit 和 X 上反馈模型「变笨了」—— 输出变得健忘、重复、废话连篇,甚至在复杂任务中表现明显退步。 ...

2026-04-24 · 20 分钟 · 3642 字 · cjraft

AI 浏览器自动化工具对比

这篇文章主要对 browser-use、Chrome DevTools MCP 和 agent-browser 三类工具做一个并排分析,方便在不同场景下做选型。 它们看起来都属于“AI + 浏览器自动化”,但本质上处于不同抽象层: ...

2026-03-18 · 20 分钟 · 3676 字 · cjraft

Ralph Loop:让 AI 自己跑完全程

一句话定义:Ralph Loop 是一个"把 AI 放进 while true 里"的自主迭代开发技术——你定义终点,AI 自己跑,跑完为止。 是什么 Ralph Loop(也叫 Ralph Wiggum Loop): ...

2026-01-30 · 21 分钟 · 3764 字 · cjraft

Agent Skills:从概念到实践的技术剖析

一、前言 想象一下,你雇了一位实习生,开始时你教了一些规范: “我们公司的 PPT 要用这个颜色,这个字体,Logo 放左上角……” “代码审查要检查这些安全项,那些性能点……” ...

2025-12-07 · 32 分钟 · 5803 字 · cjraft