当前位置: 首页 > article >正文

如何使用 Python Pandas 更新行和列

让我们了解如何使用 Python pandas 更新行和列。 在现实世界中,大多数时候我们没有准备好分析数据集。 可能存在许多不一致、无效值、不正确的标签等等。 话虽如此,更新这些值以实现数据的一致性是非常有必要的。 在本篇文章中,我们将重点介绍如何使用 pandas 更新 Python 中的行和列。 不用花太多时间在介绍上,让我们开始行动吧!


1. 创建 Pandas 数据集

在整篇文章中,我们将使用我们现在要创建的数据框。 这将使大家了解更新数据操作。 在此之后,大家可以将这些方法应用于自己的数据。

为了创建数据框,pandas 提供了函数名称 pd.DataFrame,它可以帮助您从一些数据中创建数据框。 让我们看看它是如何工作的。

#创建一个字典

import pandas as pd

fruit_data = {"Fruit": ['Apple','Avacado','Banana','Strawberry','Grape'],"Color": ['Red','Green','Yellow','Pink','Green'],
"Price": [45, 90, 60, 37, 49]
}

fruit_data

在这里,我们创建了一个 Python 字典,其中包含一些数据值。 现在,我们被要求将这本字典变成Pandas数据集。

#Dataframe 

data = pd.DataFrame(fruit_data)
data

创建 Pandas 数据集

那很完美!使用 pandas 的 pd.DataFrame 函数,我们可以轻松地将字典转换为 pandas 数据集。 我们的数据集现在已准备好执行未来的操作。


更新列

有时,要素的列或名称会不一致。 它可以是字母表的大小写等等。 拥有统一的设计有助于我们有效地使用这些功能。

因此,作为第一步,我们将了解如何更新/更改数据中的列或特征名称。

#update the column name

data.rename(columns = {'Fruit':'Fruit Name'})

更新列

如上图所示简单。 大家甚至可以一次更新多个列名。 为此,我们必须在大括号下添加以逗号分隔的其他列名。

#multile column update

data.rename(columns = {'Fruit':'Fruit Name','Colour':'Color','Price':'Cost'})

就像这样,我们可以同时更新所有列。


更新列名的大小写

在处理具有许多列的数据集时,我们可能会遇到列名不一致的情况。

在我们的数据中,大家可以观察到所有列名的首字母大写。 始终建议为所有列名使用通用大小写。

好吧,我们可以将它们转换为大写或小写。

#lower case

data.columns.str.lower()
data

更新列名的大小写

现在,我们所有的列名都是小写的。


更新行

和更新列一样,更新行也很简单。 我们必须先找到行值,然后才能使用新值更新该行。

我们可以使用 pandas loc 函数来定位行。

#updating rows

data.loc[3]
Fruit    Strawberry
Color          Pink
Price            37
Name: 3, dtype: object

我们找到了第 3 行,其中包含水果草莓的详细信息。 现在,我们必须用一个名为 Pineapple 的新水果及其详细信息来更新这一行。

#update

data.loc[3] = ['PineApple','Yellow','48']
data

更新行

我希望大家也发现更新数据中行的值很容易。 现在,假设我们只需要更新行中的一些细节,而不是整个细节。 那么,您对此有何看法?

#更新特定值

data.loc[3, ['Price']]
Price    48
Name: 3, dtype: object

我们只需要更新位于第 3 行的水果的价格。 我们知道该水果的当前价格是 48。但是,我们必须将其更新为 65。让我们这样做。

#updating 

data.loc[3, ['Price']] = [65]
data

更新行

我们只用一行 python 代码将水果菠萝的价格更新为 65。 这就是它的工作原理。 简单的。


根据条件更新行和列

是的,我们现在将根据特定条件更新行值。 最后,我们想要一些有意义的值,这些值应该有助于我们的分析。

让我们定义我们的条件。

#Condition

updated = data['Price'] > 60
updated

我们在这里要做的是,将价格高于 60 的水果的价格更新为昂贵。

0    False
1     True
2    False
3     True
4    False
Name: Price, dtype: bool

根据输出,我们有 2 个价格超过 60 的水果。让我们在数据中将这些水果列为昂贵的。

#Updating

data.loc[updated, 'Price'] = 'Expensive'
data

根据条件更新行和列

你以惊人的方式和完美地做到了。 在整篇文章中,我使用的代码从未超过 2 行。 我能给出的最好建议是,尽可能多地学习 pandas。 它是一个如此强大的库,它提供了许多单行函数,但能够出色地完成工作。


总结 - 更新行和列

更新数据中的行和列是我们在进行任何分析之前应该关注的一件主要事情。 通过简单的函数和代码,我们可以让数据变得更有意义,在这个过程中,我们肯定会对数据质量和任何进一步的要求有所了解。 如果我们的数据正确无误,相信我,我们可以发现许多珍贵的前所未闻的事情。


http://www.kler.cn/a/4599.html

相关文章:

  • primitive 编写着色器材质
  • <代码随想录> 算法训练营-2025.01.09
  • Golang 设计模式
  • 【MySQL实战】mysql_exporter+Prometheus+Grafana
  • 算法妙妙屋-------2..回溯的奇妙律动
  • Redis快速入门店铺营业状态设置
  • 微信小程序实战:智能水印相机小程序开发附源码
  • 大文件分片上传的实现【前后台完整版】
  • 安装Maven、搭建Maven环境、使用Eclipse创建Maven工程
  • 基于springboot实现农机电招平台【源码+论文】分享
  • 大数加法【算法解析、代码模板、思路简单清晰】
  • 使用Vue脚手架(CLI)创建Vue项目并分析项目结构
  • JAVA入门(开发环境和一些概念)
  • 华为OD机试题,用 Java 解【自动曝光】问题 | 含解题说明
  • 【git】将本地项目同步到远程
  • keepalived
  • 【华为OD机试 2023最新 】 新员工座位(C++)
  • 基于springboot+vue仓库管理系统(程序+数据库)
  • 【机器学习】03-转换器和预估器、K-近邻算法、朴素贝叶斯算法、决策树等算法知识
  • 超好用的浏览器兼容性测试工具,赶紧收藏!
  • JConsole使用教程
  • JSON 数据类型
  • 二叉树结构的实现
  • 全国首个、大势共建 | 实景三维领域部级工程技术创新中心正式挂牌运营
  • 2022蓝桥杯Java A组、B组
  • 数据结构与算法:堆和栈的区别概述