Ryo's blog

标签 · AI

首页

关于

归档

AI

AGENTS.md 加载机制调研

概述 AGENTS.md 是 Codex 的项目级指令文件,用于向模型传递用户自定义的编码规范、项目说明、构建步骤等指导信息。系统会沿目录层级发现并加载这些文件,将其序列化后注入对话上下文,并在 compaction 时正确过滤和重新注入。 1. 文件发现:discover_project_doc_paths() 文件:core/src/project_doc.rs:207 1.1 发现算法 从当前工作目录(config.cwd)向上遍历,寻找 project_root_markers(默认为 .git)标识的项目根目录 收集从项目根到当前工作目录路径上每个目录中的 AGENTS.md 文件 不会遍历超过项目根目录 如果没有找到项目根标记,只搜索当前工作目录 1.2 文件优先级 每个目录下..

更多
AI

CLAUDE.md 加载机制调研

基于 claude-code 2.1.70 源码分析 一、文件加载 1.1 加载顺序(loadMemoryFiles / VJ) 所有文件拼接到 prompt 中(不是覆盖),后加载的优先级更高: 阶段 类型 路径 备注 1 Managed 组织管理路径 + managed .claude/rules/ 组织统一下发 2 User ~/.claude/CLAUDE.md + ~/.claude/rules/ 用户全局 3 Project 目录树遍历:{dir}/CLAUDE.md、{dir}/.claude/CLAUDE.md、{dir}/.claude/rules/ 从外→内 4 Local 目录树遍历:{dir}/CLAUDE.local.md 不提交 git ..

更多
loading..
AI

Sandbox:给 Agent 一个家

项目地址: https://github.com/deep-agent/sandbox/ 背景 什么是 Sandbox 在计算机安全领域,沙箱(Sandbox) 是一种为运行中的程序提供隔离环境的安全机制。它就像一个"安全的游乐场"——程序可以在其中自由运行,但无法影响外部系统。 对于 AI Agent 而言,Sandbox 可以理解为一台分配给每个任务的 “云端虚拟电脑”。它具备完整的操作系统能力:网络访问、文件系统、浏览器、各种软件工具,让 AI 能够像人类一样操作计算机来完成任务。AI 代码沙箱正在成为 AI Agent 平台的底层标准基础设施。 Sandbox 典型应用场景有: AI Coding Agent:Manus、Replit、Lovable 等 web vibe coding 产..

更多
AI

上下文工程调研-Claude Code

Claude Code (v2.1.19) 编译产物分析 下载 cc node.js 编译后的产物: npm pack @anthropic-ai/claude-code tar -xzf anthropic-ai-claude-code-*.tgz 产物目录结构: package/ ├── LICENSE.md (147B) - 许可证文件 ├── README.md (2.0KB) - 说明文档 ├── package.json (1.2KB) - 包配置文件 ├── cli.js (11.6MB) - 主要 CLI 入口文件(打包后的代码) ├── sdk-tools.d.ts (67..

更多
AI

Web Vibe Coding 调研

背景 近期 AI Coding 产品热度攀升,产品形态也从「辅助写代码」快速演进到「围绕真实项目交付的端到端工作流」。一类典型的 Web Vibe Coding 产品,往往同时提供在线开发环境、具备工具调用能力的代码 Agent,以及一键部署与预览能力,让用户用更低的心智成本完成从想法到可运行应用的闭环。 最近我们也在做 Web Vibe Coding 的产品,所以也做了下调研。 Web Vibe Coding 产品调研 市面上比较火的 Web Vibe Coding 产品主要有几款:Lovable、Replit、Manus。 Lovable ARR 2 亿美金,估值 66 亿 (2025 年 12 月) 优点 MVP 和原型制作速度极快 无需编程技能 可视化编辑免费 适用人群 非技术创始人..

更多
AI

《Trae 架构调研》

前言 最初,AI 编程体现为 AI Chat 模式,开发者在对话框中提问,大模型则返回包含代码块的 Markdown 响应。这是一种典型的“代码片段”模式,开发者需要手动复制、粘贴、修改,模型扮演的是一个“增强版搜索引擎”的角色。这种模式的局限性显而易见:代码零散、缺乏上下文、无法直接运行。 随后,业界演进出了 Artifacts(产物)模式。以 V0 等产品为代表,通过特定的 Prompt 词或 XML 标签引导,模型可以在一次交互中生成一个完整(但通常非常简单)的前端项目代码。后端服务解析这些结构化输出,自动创建文件,从而交付一个可直接运行的迷你项目。然而,受限于模型的输出 Token 限制,这种方式难以应对包含数十个文件、逻辑复杂的大型项目。 真正的挑战在于:如何让 AI 在大型项目的迭代中持续..

更多
AI

上下文工程业界最佳实践

基础概念 什么是上下文? 简单说就是:发送给大模型的所有信息被称为上下文。包括但不仅限于 system/user 提示词、约束规则、示例、工具说明、历史对话、摘要、长期记忆、检索结果、数据库/代码执行返回、用户权限与业务状态等。 什么是上下文工程? 上下文工程(Context Engineering)是围绕“在有限上下文窗口内,让模型看到最有用的信息、并按最有效的方式呈现”所做的系统化设计与实现。它把一次模型调用当成一个信息管道问题:哪些信息该进入上下文、以什么形式进入、放在什么位置、如何随对话演进而更新,最终目标是提升输出的正确性、稳定性、可控性与成本效率。 优化方向的一些总结 Context Retrieving(选择性取回):需要时从外部存储(笔记/记忆/数据源)检索并注入当前步骤必需的信..

更多
AI

《机器学习》笔记七 - 贝叶斯分类器

7.1 贝叶斯决策论 贝叶斯决策论是一种基于概率的方法,用于在分类任务中根据已知的概率信息和误判损失选择最优类别。它的核心思想是通过最小化决策风险来达到最佳决策效果。 1. 基本概念 1.1 类别标记 假设有 NNN 种可能的类别,记为 Y={c1,c2,…,cN}\mathcal{Y} = \{c_1, c_2, \ldots, c_N\}Y={c1​,c2​,…,cN​}。 1.2 误判损失 定义 λij\lambda_{ij}λij​ 为将真实类别为 cjc_jcj​ 的样本误分为 cic_ici​ 时的损失。 1.3 后验概率 P(ci∣x)P(c_i \mid \boldsymbol{x})P(ci​∣x) 表示在给定样本 x\boldsymbol{x}x 的情况下,样本属于类别..

更多
AI

《机器学习》笔记五 - 神经网络

5.1 神经元模型 神经网络是一门多学科交叉的研究领域,它由大量简单而具适应性的单元(即神经元)构成,这些神经元通过复杂的并行连接组成网络。我们在机器学习中讨论的神经网络,实际上是数学模型和学习算法的交汇点。 1. 神经元模型:基本单元 生物神经元的工作原理: 互联与传递信号: 在生物神经系统中,每个神经元都与其他神经元相连。当一个神经元被激活(或称“兴奋”)时,它会向与之连接的神经元传递化学信号,这些信号会改变接收神经元的电位。 阈值触发: 如果一个神经元接收到的总信号使其电位超过某个预设的“阈值”,它就会被激活,进而向其他神经元传递信号。 M-P神经元模型: 提出背景: 1943年,[McCulloch and Pitts, 1943] 把生物神经元的工作方式抽象为一个数学模型,这就是经典..

更多
AI

《机器学习》笔记四 - 决策树

4.1 基本流程 决策树是一种直观、类似“问答式”的分类方法,其基本思想就是通过一系列简单的判断(例如“这个瓜的颜色是不是青绿?”、“这个瓜的根蒂形状如何?”)一步步把样本分类。 4.1.1 决策树的基本概念 树结构:决策树由“结点”和“分支”组成。 根结点:放着所有的样本,表示开始决策的起点。 内部结点:每个内部结点对应一个“属性测试”,例如“色泽是否青绿?”。 叶结点:当经过一系列属性测试后到达的结点,叶结点直接给出最终的分类结果,比如“好瓜”或“坏瓜”。 决策过程:从根结点开始,根据样本在各个属性上的取值,沿着相应的分支不断向下走,直到到达叶结点,这一路上问的问题就构成了一个“测试序列”。 4.1.2 决策树如何“学习” 决策树学习的目标是从训练数据中自动生成这样一棵树,使..

更多
AI

《机器学习》笔记三 - 线性模型

3.1 基本形式 1. 线性模型的基本形式 问题背景:假设每个示例由 ddd 个属性描述,记为 x=(x1,x2,…,xd)\boldsymbol{x} = (x_1, x_2, \ldots, x_d) x=(x1​,x2​,…,xd​) 其中 xix_ixi​ 是示例在第 iii 个属性上的取值。 模型定义:线性模型试图通过属性的线性组合来进行预测,其形式为 f(x)=w1x1+w2x2+⋯+wdxd+b(3.1)f(\boldsymbol{x}) = w_1x_1 + w_2x_2 + \cdots + w_dx_d + b \quad (3.1) f(x)=w1​x1​+w2​x2​+⋯+wd​xd​+b(3.1) 这里,w1,w2,…,wdw_1, w_2, \ldots, w_dw1..

更多
AI

《机器学习》笔记二 - 模型评估与选择

2.1 经验误差与过拟合 误差相关概念 错误率与精度:在分类任务里,错误率是指分类错误的样本数在样本总数中所占的比例。假设样本总数为mmm,其中分类错误的样本数为 ,那么错误率 。而精度则是分类正确的样本数占样本总数的比例,即精度 = 1 - 错误率,通常会以百分比的形式呈现,如 。 经验误差与泛化误差:学习器在训练集上所产生的误差被称为经验误差或者训练误差,而在新样本上的误差则叫做泛化误差。我们的目标是获得泛化误差小的学习器,因为这意味着它在面对未知数据时也能有较好的表现。然而,在实际操作中,由于我们事先并不清楚新样本的具体情况,所以往往只能尽力使经验误差最小化。 过拟合与欠拟合 过拟合:当学习器把训练样本学得过于透彻,以至于将训练样本特有的一些非普遍特性也当作所有潜在样本都具备的一般..

更多
AI

《机器学习》笔记一

一、绪论 1.1、什么是机器学习? 机器学习是人工智能(AI)的一个分支,其核心目标是让计算机能够从数据中自动“学习”——也就是说,不需要人为编写每一个规则,而是通过算法和统计模型提取数据中的规律,从而对未知数据进行预测或做出决策。 深度学习:神经网络类的机器学习算法。 人工智能 > 机器学习 > 深度学习 1.2、机器学习中的一些基本概念 算法 算法是指从数据中学得模型的具体方法,例如线性回归、对数几率回归、决策树等。算法的输出称为模型,通常可以看作具体的函数或抽象函数。例如一元线性回归算法产出的模型可表示为 f(x)=wx+bf(x) = wx + b f(x)=wx+b 样本 样本(Sample)指数据集中单个、具体的实例或观测值。每个样本代表一个独立个体(如图片、文本、交..

更多