当前位置: 首页 > article >正文

2、ChatGPT 在数据科学中的应用

ChatGPT 在数据科学中的应用

ChatGPT 可以成为数据科学家的绝佳工具。以下是我所了解到的关于它擅长的地方和不那么擅长的地方。


在这里插入图片描述

我从使用 ChatGPT 中学到了一个教训。它在数据科学中非常有帮助,但你必须仔细检查它输出的所有内容。它非常适合某些任务,并且可以非常快速准确地完成它们。对于其他一些任务,它已经足够好了,您必须多次提示它。我发现 ChatGPT 在一项任务上非常糟糕。

擅长:自动执行数据探索

您可以将您的数据集附加到 ChatGPT 消息中,通过给出一些简单的说明,ChatGPT 可以为您探索数据。

例如,我可以从这个数据项目中获取一个数据集。我给出的指示是:

“使用附加的数据进行描述性统计分析。包括以下内容:

  • 汇总基本统计数据(平均值、中位数、标准差等)。
  • 识别缺失值并提出处理它们的策略。

它返回如下所示的摘要。它对每个变量执行相同的计算。

年龄:

  • 平均值: 28.79 years
  • 标准差: 6.94 年
  • 范围:18至50年

它还未识别数据集中的缺失值。

如果还需要用于这些计算的 Python 代码,则可以提示它编写它们。

若要加载数据集,请使用此代码。

aerofit_data = pd.read_csv(file_path)

对于基本统计数据,它给出了这个。

basic_stats = aerofit_data.describe()

您可以使用此代码检查缺失值。

missing_values = aerofit_data.isnull().sum()

很棒:创建可视化效果

此外,我可以要求 ChatGPT 可视化关键变量的分布,并检测潜在的异常值和异常情况。

它为关键变量创建直方图和箱形图:年龄、收入和里程。它检测到收入和里程分布中可能存在的异常值。
在这里插入图片描述


http://www.kler.cn/a/233801.html

相关文章:

  • Qt 和 WPF(Windows Presentation Foundation)
  • AI制作ppt
  • 力扣515:在每个树行中找最大值
  • CentOS 服务
  • python: postgreSQL using psycopg2 or psycopg
  • 【QT】QSS
  • Istio1.6官方文档中文版
  • C++2024寒假J312实战班2.5
  • 正点原子--STM32通用定时器学习笔记(2)
  • 速盾:海外服务器用了cdn还是卡怎么办
  • 【CSS】什么是BFC?BFC有什么作用?
  • Android 11 webview webrtc无法使用问题
  • cool 框架 node 后端封装三方Api post请求函数
  • NLP_Bag-Of-Words(词袋模型)
  • 如何进行游戏服务器的负载均衡和扩展性设计?
  • VUE学习——事件参数
  • 每天一个数据分析题(一百五十六)
  • moduleID的使用
  • 【学习笔记】【内核】offsetof 的用法
  • 算法学习——LeetCode力扣二叉树篇1
  • c# 时间帮助类
  • 2.6:冒泡、简选、直插、快排,递归,宏
  • VMware虚拟机安装openEuler系统(一)(2024)
  • Idea里自定义封装数据警告解决 Spring Boot Configuration Annotation Processor not configured
  • Qt QML学习(一):Qt Quick 与 QML 简介
  • 【资料分享】基于单片机大气压监测报警系统电路方案设计、基于飞思卡尔的无人坚守点滴监控自动控制系统设计(程序,原理图,pcb,文档)