当前位置: 首页 > article >正文

【开源项目-爬虫】Firecrawl

看到其他项目引用了这个项目 Firecrawl

用免费额度试了一下,这个项目和之前的 https://r.jina.ai/ 很像(类似的还有 https://www.scrapingbee.com/?),将爬取到的网页转换为 markdown 格式,这样大语言模型用起来就很方便

商业模式就是卖 api,看了一下如果长期大量跑价格不便宜

不过好在还可以本地部署,本地部署的话,不知道代理什么的怎么配置,没有细看


分别用小红书的浏览器首页(小红书 - 你的生活指南)和详情页试了一下

firecrawljina
可以从首页拿到详情页链接可以可以
可以拿到详情页标题 + 图片可以拿不到

通过简单的测试看起来比 jina 强一点点,不过 jina 实际可以白嫖,但 firecrawl 没有深入研究能不能白嫖


官网地址(可以免费尝试):Firecrawl

github 地址(fork 2.6k,star 30k+):GitHub - mendableai/firecrawl: 🔥 Turn entire websites into LLM-ready markdown or structured data. Scrape, crawl and extract with a single API.


http://www.kler.cn/a/584948.html

相关文章:

  • MySQL行列转化
  • 开VR大空间体验馆,如何最低成本获取最大收入?
  • 深度学习环境配置指令大全
  • go-文件缓存与锁
  • C#中除了Dictionary,List,HashSet,HashTable 还有哪些可以保存列表的数据类型?
  • 批量将 Excel 文档中的图片提取到文件夹
  • 如何学习VBA_3.2.20:DTP与Datepicker实现日期的输入
  • 罗德与施瓦茨RTO1044,数字示波器
  • 大数据面试之路 (一) 数据倾斜
  • C++程序设计语言笔记——基本功能:异常处理
  • 如何接入DeepSeek布局企业AI系统开发技术
  • JVM内存结构笔记01-运行时数据区域
  • 记录致远OA服务器硬盘升级过程
  • Qt常用控件之水平布局QHBoxLayout
  • node基础
  • 【YOLOv8】YOLOv8改进系列(6)----替换主干网络之VanillaNet
  • Python 机器学习小项目:手写数字识别(MNIST 数据集)
  • 蓝桥杯备赛-基础练习 day1
  • linux 构建网站环境
  • 【模拟面试】计算机考研复试集训(第二天)