【Pandas】(1)安装与Series
Pandas是一个开源的Python数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。它是基于NumPy库构建的,使得数据预处理、清洗、分析变得更加快速和简单。Pandas主要有两种类型的数据结构:Series
(一维数组)和DataFrame
(二维表格)。
注意:和Numpy相比,Pands的计算速度会慢一些,它更侧重于数据处理。
安装
如果你还没有安装Pandas,可以通过pip安装:
pip install pandas
导入
导入Pandas库,通常我们给它一个别名pd
:
import pandas as pd
Series
Pandas 的 Series
是一个一维的标签化数组,能够存储任何数据类型(整数、字符串、浮点数、Python 对象等)。Series
是 Pandas 中最基本的对象之一,提供了丰富的功能来进行高效的数据操作和分析。
创建 Series
你可以使用 pd.Series()
函数来创建一个 Series
对象,其基本语法如下:
pd.Series(data=None, index=None, dtype=None, name=None)
data
:数据,可以是列表、字典、ndarray 等。index
:索引值,是数据标签。如果不指定,默认为RangeIndex(0, 1, 2, ...)
。dtype
:数据类型,如果不指定,将自动推断。name
:Series
的名称。
import pandas as pd
import numpy as np
# 通过列表创建 Series
s1 = pd.Series([1, 3, 5, np.nan, 6, 8])
# 通过字典创建 Series,自动使用字典键作为索引
s2 = pd.Series({
'a': 1, 'b': 2, 'c': 3})
# 指定索引和数据类型
s3 = pd.Series([10,