Thinking about debug agent 探讨Debug Agent的设计思考,分析用户上下文、程序上下文和自动化交互方案三个核心组成部分,与Coding Agent的差异与环境感知需求 2025-10-09 技术分享 #LLM #Agent #Vibe coding #Debug
Evals is misleading? 探讨LLM评估方法的局限性,分析LLM-as-Judge和A/B实验等评估方式的问题,思考我们应该如何正确看待AI模型评估 2025-09-10 技术分享 #随笔 #LLM
LLM只是计算,Context才是内存 深入探讨LLM的Context Engineering理念,分析检索模式与阅读模式的优劣,理解Context作为LLM内存的核心概念 2025-09-02 技术分享 #随笔 #LLM
AI Native的产品更应该暴露错误 探讨AI时代产品设计的成长性原则,分析暴露错误如何帮助用户和产品一起成长,构建反脆弱的产品体验 2025-07-26 随笔 #AI #LLM #产品设计 #AGI
Architecture of Agent System 记录Agent系统架构调研,包括Long-term Memory系统设计、Browser-use工具设计和代码执行沙箱架构 2025-07-20 技术分享 #LLM #Architecture #Agent
Ergonomics to Agent 探讨Agent产品的人体工学设计,分析TODO工具如何增强用户对Agent的掌控和理解,让用户在使用中成长 2025-07-05 随笔 #产品设计 #Product Design
AGI is possible and impossible 探讨AGI技术发展与制度框架的深层矛盾,分析治理滞后、资源扭曲、法律不适应等问题,以及AGI可能带来的社会分化。 2025-06-21 随笔 #AGI