| yuebin's blog

Posted on 2026-04-10

你问的这个 WebClaw，和刚才提到的 Automa 以及 page-agent.js 虽然都涉及网页操作，但角色完全不同。如果做个类比：

Automa 像是一位 个人助理：在你的浏览器里，帮你自动完成点击、填表等重复操作。
WebClaw 则更像一个 AI 的专职资料研究员：它的任务是把互联网上的复杂网页，转换成 AI 能快速阅读、干净整洁的 Markdown 文档。

WebClaw 是一个为 AI 智能体（Agent） 和大语言模型（LLM）设计的网页内容提取工具。它的核心任务是爬取网页，然后剥离广告、导航栏、页脚等“噪音”，只把最核心的正文内容提炼成结构清晰的 Markdown 格式。

它的主要价值体现在两点：

绕过反爬虫机制：很多网站（尤其是使用了 Cloudflare 防护的）会拦截普通的爬虫脚本。WebClaw 的一个核心优势是能通过 TLS 指纹技术模拟真实浏览器，无需启动笨重的无头浏览器就能拿到数据。
为 AI 节省成本：AI 处理网页是按 Token 付费的。WebClaw 输出的干净内容，能将 Token 数量最高降低 67%，相当于直接帮你省下了一大笔 API 调用费用。

WebClaw 的使用门槛比 Automa 稍高一些，主要面向开发者。它有 MCP Server（一个标准化的 AI 工具接口）、命令行（CLI） 和 REST API 三种使用方式。

最主流的方式是把它配置到 Claude Desktop 或 Cursor 这类支持 MCP 的 AI 编程工具里。以 macOS 为例，配置流程大致如下：

{
  "mcpServers": {
    "webclaw": {
      "command": "webclaw-mcp",
      "args": []
    }
  }
}

安装方式：可以通过 Homebrew 一键安装，或者去 GitHub 下载二进制文件。

在这个赛道，Firecrawl 是 WebClaw 最直接、最有力的竞争者。

对比维度	WebClaw	Firecrawl
核心定位	轻量级、本地优先的 AI 内容提取工具	功能全面的云端网页抓取 API 服务
反爬能力	依赖 TLS 指纹伪装，轻量级绕过	依赖强大的云端浏览器池和代理网络，能力更强
技术栈与性能	Rust 开发，性能极高（宣称亚毫秒级提取），资源占用少	基于 Node.js/云服务，功能更全但本地运行资源开销相对大
易用性与集成	主打 MCP 集成，无缝对接 AI 工具；8/10 的功能免费本地用	提供 SDK 和 API，上手简单，但重度依赖云服务
适用人群	开发者、极客，追求隐私、速度，喜欢将工具集成在自己的 AI 工作流	企业用户、快速原型开发者，追求开箱即用，愿意为云服务付费

如果你想继续深耕本地 AI 自动化（比如把 WebClaw 接入你的私人 Claude 助手，或写脚本批量采集文章喂给知识库），那 WebClaw 的免费、高速和 MCP 原生集成 很有吸引力。
如果你要处理极其复杂的动态网站（如大型电商详情页），或者不想折腾本地环境，只想调一个 API 就拿到结果，那 Firecrawl 的云端服务会是更稳定、更强大的选择，当然这需要付费。