当前位置: 首页 > article >正文

ChatGPT被曝存在爬虫漏洞,OpenAI未公开承认

OpenAI的ChatGPT爬虫似乎能够对任意网站发起分布式拒绝服务(DDoS)攻击,而OpenAI尚未承认这一漏洞。

本月,德国安全研究员Benjamin Flesch通过微软的GitHub分享了一篇文章,解释了如何通过向ChatGPT API发送单个HTTP请求,利用ChatGPT爬虫(特别是 ChatGPT-User)向目标网站发起大量网络请求。攻击者可以将单个API请求放大为每秒20到5000次甚至更多的请求,持续不断地发送到目标网站。从实际操作来看,这种连接的洪流虽然不足以使任何网站瘫痪,但仍被认为是一种潜在的危险,也暴露了OpenAI 的疏忽。

Flesch在他的报告中指出:“ChatGPT API在处理向 https://chatgpt.com/backend-api/attributions发送的HTTP POST请求时,表现出严重的质量缺陷。”他提到的API端点,被ChatGPT用于返回聊天机器人输出中引用的网络来源信息。当ChatGPT提到特定网站时,它会调用“attributions”接口,并附带这些网站的URL列表,供爬虫访问并获取相关信息。如果向API发送一个包含大量URL的列表,每个URL略有不同但都指向同一个网站,爬虫会立即访问所有这些URL 。

Flesch写道:“API期望在参数urls中接收一个超链接列表。众所周知,指向同一网站的超链接可以以多种不同的方式编写。由于编程实践不当,OpenAI没有检查列表中是否多次出现指向同一资源的超链接。 OpenAI也没有对urls参数中存储的超链接数量设置上限,从而允许在单个HTTP请求中传输数千个超链接。”

因此,攻击者可以使用Curl等工具向ChatGPT端点发送HTTP POST请求,无需身份验证令牌。OpenAI在微软Azure上的服务器将响应此请求,并为通过urls[]参数提交的每个超链接发起HTTP请求。当这些请求指向同一个网站时,可能会使目标网站不堪重负,出现DDoS症状——由Cloudflare代理的爬虫每次都会从不同的IP地址访问目标网站。

“受害者永远不会知道发生了什么,因为他们只看到同一时间,ChatGPT机器人从大约20个不同的IP地址访问他们的网站。”Flesch说。他还补充道,即使受害者启用了防火墙来阻止ChatGPT机器人使用的IP地址范围,机器人仍然会发送请求。“因此,一个失败或被阻止的请求,不会阻止ChatGPT机器人在下一毫秒再次请求受害者网站。由于这种放大效应,攻击者可以向ChatGPT API发送少量请求,但受害者将收到大量请求。”

Flesch 通过多个渠道报告了这一未经身份验证的反射型DDoS漏洞,包括OpenAI的BugCrowd漏洞报告平台、OpenAI安全团队的电子邮件、微软和HackerOne,但至今未收到任何回复。

Flesch认为更大的问题是这个API还容易受到提示注入攻击。Flesch质疑,为什么OpenAI机器人没有实现简单且成熟的方法,以正确去重请求列表中的URL,或者限制列表的大小,也没有解决在ChatGPT主界面中已修复的提示注入漏洞。

Flesch 说:“在我看来,这个小API似乎是ChatGPT AI代理的一个示例项目,任务是从用户提供的数据中解析出URL,然后使用Azure抓取网站。‘AI代理’没有内置安全功能吗?显然,处理 urls[]参数的‘AI 代理’没有资源耗尽的概念,也不明白为什么在同一秒内向同一网站发送数千个请求是愚蠢的。难道它没有意识到victim.com/1和victim.com/2都是指向同一个网站victim.com吗?如果victim.com/1的请求失败了,为什么还会立即向victim.com/2发送请求呢?这些都是人们多年来在软件中实施的验证逻辑,以防止此类滥用现象出现。 ”

Flesch表示,唯一能想到的解释是OpenAI正在使用AI代理来触发这些HTTP请求。“我无法想象一个高薪的硅谷工程师会设计出这样的软件,因为ChatGPT爬虫已经像谷歌爬虫一样在网络上爬行了多年。如果爬虫不限制对同一网站的请求数量,它们会立即被屏蔽。”


http://www.kler.cn/a/512044.html

相关文章:

  • 基于VSCode+CMake+debootstrap搭建Ubuntu交叉编译开发环境
  • C# OpenCvSharp 部署文档矫正,包括文档扭曲/模糊/阴影等情况
  • 风吹字符起,诗意Linux:一场指令与自由的浪漫邂逅(上)
  • 重温STM32之环境安装
  • Visual Studio Code + Stm32 (IAR)
  • 蓝桥杯刷题第二天——背包问题
  • 2025年美国大学生数学建模竞赛赛前准备计划
  • 【技术杂谈】Arcgis调用天地图和卫星影像
  • Spring Web MVC 探秘
  • Nginx location 和 proxy_pass 配置详解
  • 后端开发流程学习笔记
  • Linux 高级路由与流量控制-用 tc qdisc 管理 Linux 网络带宽
  • 【通信协议】TCP通信
  • 记录一个简单小需求,大屏组件的收缩与打开,无脑写法
  • 【日志篇】(7.6) ❀ 01. 在macOS下刷新FortiAnalyzer固件 ❀ FortiAnalyzer 日志分析
  • 【数据结构篇】顺序表 超详细!
  • AAAI2024论文解读|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心
  • 【云原生布道系列】第三篇:“软”饭“硬”吃的计算
  • 在离线无管理员权限的情况下为Linux配置oh-my-zsh(zsh+oh my zsh+powerlevel10k)
  • 2025年免费量化交易软件——PTrade(含开通攻略)
  • .Net Core微服务入门全纪录(六)——EventBus-事件总线
  • 如何用selenium来链接并打开比特浏览器进行自动化操作(1)
  • 30天开发操作系统 第 16 天 -- 多任务 v2.0
  • 2025/1/20 学习Vue的第三天
  • 云计算技术深度解析与实践案例
  • OpenCV笔记3-图像修复