背景
近期 AI Coding 产品热度攀升,产品形态也从「辅助写代码」快速演进到「围绕真实项目交付的端到端工作流」。一类典型的 Web Vibe Coding 产品,往往同时提供在线开发环境、具备工具调用能力的代码 Agent,以及一键部署与预览能力,让用户用更低的心智成本完成从想法到可运行应用的闭环。
最近我们也在做 Web Vibe Coding 的产品,所以也做了下调研。
Web Vibe Coding 产品调研
市面上比较火的 Web Vibe Coding 产品主要有几款:Lovable、Replit、Manus。
- Lovable
- ARR 2 亿美金,估值 66 亿 (2025 年 12 月)
- 优点
- MVP 和原型制作速度极快
- 无需编程技能
- 可视化编辑免费
- 适用人群
- 非技术创始人、设计师、产品经理,需要快速验证想法的人。
- Replit
- ARR 2.5 亿美元,估值 90 亿美元 (2026 年 1 月)
- 优点
- 对代码和基础设施有完全控制权
- 支持多人协同编辑。
- 支持 50+ 种语言:Python、JavaScript、Go、Rust 等
- 适用人群
- 开发者、技术团队、想要加速工作流程但不放弃控制权的程序员。
- Manus
- ARR 1 亿美元,估值数十亿美元 (2025 年 12 月)
- Manus 算通用通用型自主智能体 (General-Purpose Autonomous Agents), Vibe Coding 只是他里面的功能之一
- 优点
- 真正的端到端解决方案
- 无供应商锁定
- 可处理编码之外的任务
- 适用人群
- 创业者、需要从想法到执行全程支持的人、希望 AI 处理整个工作流程的用户。
其他类型的 Vibe Coding 产品
IDE和代码编辑器
- Trae - The Real AI Engineer
- Windsurf Editor by Codeium - 主打"Flow"概念的AI原生IDE,已被OpenAI以30亿美元收购,强调人机协作的编程体验。
- Cursor - 基于VS Code的AI原生代码编辑器,母公司Anysphere估值90亿美元,2025年AI编程领域最受欢迎的工具之一。
- Zed - Atom和Tree-sitter原作者开发的高性能代码编辑器,用Rust编写,号称市场上速度最快的AI代码编辑器。
命令行工具
- anthropics/claude-code - Anthropic推出的终端AI编程代理,能理解整个代码库并自主完成项目级任务,如批量修改文件、跑自动化脚本。
- OpenAI Codex CLI - OpenAI开源的轻量级终端编程代理,发布5小时内GitHub星标破5000,支持代码生成和任务自动化。
- Gemini CLI - 谷歌开源的终端AI工具,免费提供百万token上下文,将Gemini能力直接集成到开发者终端。
插件和扩展
- Cline - VS Code上最受欢迎的AI编程插件之一,可操作CLI和编辑器,与Claude Opus 4组合成为开发者首选方案。
- GitHub Copilot - 微软推出的AI编程助手,2025年新增Agent模式和AgentHQ功能,从代码补全升级为能自主完成任务的编程代理。
Web Vibe Coding APP 架构图
Web Vibe Coding 产品,本质就是 CloudIDE + Code Agent + Deploy 的组合。不同的 Web Vibe Coding 产品侧重点不一样。下面的架构主要强调 Code Agent 这一模块。

核心功能
LLM SDK
为了减少适配各大厂商模型 SDK 的成本,我们通常会引入一层抽象好的 LLM SDK(例如 Eino、LangChain 这一类框架)。原因很直接:不同厂商在鉴权方式、请求/响应结构、流式输出、函数/工具调用、结构化输出、模型能力开关与限流错误语义上差异很大,如果每个业务模块都直连厂商 SDK,维护成本会随着模型数量和能力迭代快速失控。
有了这层抽象后,上层只关心“我要得到什么输出、我允许什么成本/延迟、我需要哪些工具能力”,而不是纠结某个厂商 SDK 的细枝末节;同时也能更从容地做多模型组合、灰度与快速切换。
Sandbox
沙箱是 Agent Runtime 最重要的组件之一。因为 Code Agent 必然需要“真的去执行”一部分动作:拉代码、改文件、装依赖、跑测试、启动服务、抓日志、做构建与打包。如果这些操作直接落在宿主机或共享环境上,风险和不可控因素会迅速放大(权限越界、依赖污染、资源争抢、相互影响、用户代码泄漏等)。沙箱的目标就是把执行环境做成可隔离、可复现、可观测、可回收的“安全容器”,让 Agent 能放开手脚做事,同时平台仍然可控。
Evaluation
评估是量化产品效果最可靠的手段。对 Vibe Coding 来说,“写得像不像”并不重要,重要的是在真实项目约束下能不能把任务做完:能否正确修改代码、能否通过测试、能否成功构建与部署、遇到失败能否自愈并给出可执行的修复方案。好的评估体系,既能作为北极星指标指导产品迭代,也能在模型升级、提示词改动、工具链调整时及时发现回归。
Context Engineering
受限于模型上下文窗口限制,所以才有 Context Engineering,市面上主流的优化手段有以下几种:
- Context Retrieving(选择性取回):需要时从外部存储(笔记/记忆/数据源)检索并注入当前步骤必需的信息,而不是把所有东西都塞进来。比如使用 RAG 或者 glob 和 grep 做文件检索。
- Context Offloading(卸载):把大块数据、工具输出、权限/状态等放到文件/DB/缓存中,提示中只保留可索引的引用(路径、URL、主键)
- Context Reduction(减少):通过压缩(Compaction)和总结(Summarization)降低 token 与噪声,但避免不可逆地丢失关键细节
- Context Isolation(隔离):通过 Multi-Agent 把指令、知识、工具原始日志、可执行结论分区;
- Context Caching(缓存):保持提示前缀稳定、上下文 append-only、序列化确定性(例如 JSON key 顺序固定),提升命中率并降低 TTFT/成本
更多参考:上下文工程业界最佳实践
Feature
更强的模型当然能抬高 Agent 的能力上限,但当大家都能接入 SOTA 模型时,真正拉开差距的往往是产品功能与工程化体验:更顺滑的任务拆解、更可靠的工具链、更好的上下文管理、更稳的执行与回滚。
就像豆包一样,模型能力未必站在最顶端,但凭借功能与体验上的持续优化,依然能给用户带来很高的实际价值,因此很多用户会觉得“很好用”。