当前位置：首页 > article >正文

【开源项目-爬虫】Firecrawl

article 2025/3/15 2:40:22

看到其他项目引用了这个项目 Firecrawl

用免费额度试了一下，这个项目和之前的 https://r.jina.ai/ 很像（类似的还有 https://www.scrapingbee.com/？），将爬取到的网页转换为 markdown 格式，这样大语言模型用起来就很方便

商业模式就是卖 api，看了一下如果长期大量跑价格不便宜

不过好在还可以本地部署，本地部署的话，不知道代理什么的怎么配置，没有细看

分别用小红书的浏览器首页（小红书 - 你的生活指南）和详情页试了一下

	firecrawl	jina
可以从首页拿到详情页链接	可以	可以
可以拿到详情页标题 + 图片	可以	拿不到

通过简单的测试看起来比 jina 强一点点，不过 jina 实际可以白嫖，但 firecrawl 没有深入研究能不能白嫖

官网地址（可以免费尝试）：Firecrawl

github 地址（fork 2.6k，star 30k+）：GitHub - mendableai/firecrawl: 🔥 Turn entire websites into LLM-ready markdown or structured data. Scrape, crawl and extract with a single API.

查看全文

http://www.kler.cn/a/584948.html

MySQL行列转化

开VR大空间体验馆，如何最低成本获取最大收入？

深度学习环境配置指令大全

go-文件缓存与锁

C#中除了Dictionary，List，HashSet，HashTable 还有哪些可以保存列表的数据类型？

批量将 Excel 文档中的图片提取到文件夹

如何学习VBA_3.2.20：DTP与Datepicker实现日期的输入

罗德与施瓦茨RTO1044,数字示波器

大数据面试之路 (一) 数据倾斜

C++程序设计语言笔记——基本功能：异常处理

如何接入DeepSeek布局企业AI系统开发技术

JVM内存结构笔记01-运行时数据区域

记录致远OA服务器硬盘升级过程

Qt常用控件之水平布局QHBoxLayout

node基础

【YOLOv8】YOLOv8改进系列（6）----替换主干网络之VanillaNet

Python 机器学习小项目：手写数字识别（MNIST 数据集）

蓝桥杯备赛-基础练习 day1

linux 构建网站环境

【模拟面试】计算机考研复试集训（第二天）

相关文章：