C

Crawl4AI

专为 AI 设计的开源网络爬虫,输出 LLM 友好的 Markdown 格式,支持 JavaScript 渲染、媒体提取、语义分块和 RAG 集成。

浏览器自动化 推荐 可协助安装 新收录
28.9kStars
17浏览
3.5kFork
7.8k安装
👤unclecode
Apache-2.0
更新于 2026-06-10

Skill 简介

专为 AI 设计的开源网络爬虫,输出 LLM 友好的 Markdown 格式,支持 JavaScript 渲染、媒体提取、语义分块和 RAG 集成。

该 Skill 面向需要提升 AI 工作流效率的用户,适合在日常开发、内容处理、资料整理和企业团队协作中快速接入。

适合谁使用

  • 开发者需要快速审查代码、生成测试用例、整理项目文档。
  • 运营与内容团队需要把重复性写作、资料分析和格式转换交给 AI 工作流处理。
  • 企业团队需要把常用 AI Skill 统一沉淀为可复用的内部工具。
  • 新手用户希望减少环境配置成本,并通过安装服务快速上手。

核心功能

  • 快速接入通过 GitHub 仓库安装,按 README 配置依赖和 API Key。
  • AI 工作流增强围绕 浏览器自动化 场景提供更稳定的自动化能力。
  • 可组合使用可与其他 Skill 组合,形成代码、文档、数据或浏览器自动化链路。
  • 持续维护项目由 unclecode 维护,当前许可协议为 Apache-2.0。

安装方式

git clone https://github.com/unclecode/crawl4ai
cd crawl4ai

# 安装依赖
npm install

# 配置环境变量
cp .env.example .env
# 编辑 .env 并填写 API Key

使用方法

安装完成后,按照仓库 README 的命令或客户端说明启用该 Skill。常见调用方式如下:

# 查看帮助
crawl4ai --help

# 运行示例任务
crawl4ai run ./examples/demo
参数类型说明
--configstring指定配置文件路径
--modestring选择运行模式,例如默认、调试或批处理
--verboseboolean输出更详细的运行日志

常见问题

Q:如何开始使用 Crawl4AI?

A:参考上方安装方式,按步骤配置后即可使用。如遇到环境问题,可购买安装服务获得一对一指导。

Q:安装过程中遇到错误怎么办?

A:优先查看 GitHub Issues 或项目 README;若仍无法解决,可购买安装协助服务。

Q:是否支持商业使用?

A:该项目使用 Apache-2.0 协议,请结合项目仓库中的许可证条款确认你的使用场景。