AIGC基础工具-科学计算和数据处理的重要库NumPy(Numerical Python)简介
文章目录
- 1. NumPy 的核心概念
- 1.1 `ndarray`:多维数组对象
- 示例代码
- 2. NumPy 的数据类型 (`dtype`)
- 示例代码
- 3. NumPy 的数组创建方法
- 3.1 使用 `array()` 创建数组
- 3.2 使用 `zeros()` 和 `ones()`
- 3.3 使用 `arange()` 和 `linspace()`
- 3.4 使用 `random` 模块生成随机数组
- 4. NumPy 数组操作
- 4.1 数组切片和索引
- 4.2 数组的形状变化
- 4.3 数学运算
- 4.4 数学函数
- 示例代码
- 5. NumPy 的线性代数功能
- 5.1 矩阵乘法
- 5.2 矩阵求逆
- 5.3 特征值和特征向量
- 6. NumPy 的广播机制
- 示例代码
- 7. NumPy 的高级操作
- 7.1 数组排序
- 7.2 集合操作
- 8. NumPy 的性能优化
- 9. NumPy 的应用领域
NumPy 是 Python 科学计算和数据处理的重要库之一,全称为 Numerical Python。它为多维数组(ndarray)和矩阵提供了支持,并且拥有大量高效的数学函数和操作。NumPy 是机器学习、深度学习和数据科学中的基础工具之一,也是其他库如 Pandas、SciPy、Matplotlib、TensorFlow 等的核心构件。
1. NumPy 的核心概念
1.1 ndarray
:多维数组对象
NumPy 中最重要的对象是 ndarray
,它是用于存储同类型数据的多维数组。与 Python 原生列表相比,ndarray
更加高效,特别是在处理大型数据集时。ndarray
具有以下重要属性:
ndim
:数组的维度数(轴数)。shape
:数组的形状,返回一个元组,表示每个维度中元素的个数。size
:数组的元素总数。dtype
:数组中元素的数据类型。itemsize
:每个数组元素所占用的字节数。
示例代码
import numpy as np
# 创建一个 2x3 的 ndarray
arr = np.array([[1, 2, 3], [4, 5, 6]])
print("数组维度:", arr.ndim)
print("数组形状:", arr.shape)
print("数组元素总数:", arr.size)
print("数组数据类型:", arr.dtype)
print("每个元素占用的字节数:", arr.itemsize)
2. NumPy 的数据类型 (dtype
)
NumPy 支持多种数据类型,比 Python 的内置数据类型更加丰富和细粒度。例如:
int8
,int16
,int32
,int64
:分别表示 8、16、32、64 位整数。float16
,float32
,float64
:表示 16、32、64 位浮点数。complex64
,complex128
:分别表示 64 位、128 位的复数。
你可以在创建数组时指定数据类型,也可以通过 astype()
方法将数组转换为其他类型。
示例代码
arr_float = np.array([1.5, 2.5, 3.5], dtype=np.float32)
arr_int = arr_float.astype(np.int32)
print(arr_int)
3. NumPy 的数组创建方法
NumPy 提供了多种创建数组的方式,除了直接通过列表或元组,还可以通过函数生成特定形状、数值范围的数组。
3.1 使用 array()
创建数组
从 Python 列表、元组等数据结构直接转换为数组。
arr = np.array([1, 2, 3, 4])
3.2 使用 zeros()
和 ones()
创建全 0 或全 1 的数组,常用于初始化数组。
zeros_array = np.zeros((3, 3)) # 3x3 的全 0 数组
ones_array = np.ones((2, 4)) # 2x4 的全 1 数组
3.3 使用 arange()
和 linspace()
arange(start, stop, step)
:返回一个在指定范围内按步长生成的等差数组。linspace(start, stop, num)
:返回一个在指定范围内生成的等间距的浮点数数组。
arr_range = np.arange(0, 10, 2) # [0, 2, 4, 6, 8]
arr_linspace = np.linspace(0, 1, 5) # [0. , 0.25, 0.5, 0.75, 1. ]
3.4 使用 random
模块生成随机数组
NumPy 的 random
模块可以生成随机数数组,如服从正态分布的随机数或 0 到 1 之间的随机浮点数。
random_array = np.random.rand(3, 3) # 3x3 的随机浮点数矩阵
normal_array = np.random.randn(3, 3) # 3x3 的正态分布随机数矩阵
4. NumPy 数组操作
4.1 数组切片和索引
NumPy 支持类似 Python 列表的切片和索引操作,但可以对多维数组进行切片。
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[0, 2]) # 访问第一行第三个元素
print(arr[:, 1]) # 访问所有行的第二列
print(arr[1:3, :]) # 切片:获取第 2 行到第 3 行的所有列
4.2 数组的形状变化
使用 reshape()
可以改变数组的形状,但前提是总元素个数不变。ravel()
和 flatten()
可以将数组展开为一维。
arr = np.array([[1, 2, 3], [4, 5, 6]])
reshaped = arr.reshape(3, 2) # 变成 3 行 2 列
flattened = arr.ravel() # 展平为一维数组
4.3 数学运算
NumPy 支持数组之间的元素级运算,如加法、减法、乘法和除法,运算速度非常快。
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
sum_arr = arr1 + arr2 # [5, 7, 9]
mul_arr = arr1 * arr2 # [4, 10, 18]
4.4 数学函数
NumPy 提供了大量数学函数,如:
np.sin()
、np.cos()
、np.tan()
:三角函数。np.exp()
、np.log()
:指数和对数函数。np.sqrt()
:开平方。
示例代码
arr = np.array([1, 4, 9])
sqrt_arr = np.sqrt(arr) # [1. 2. 3.]
5. NumPy 的线性代数功能
NumPy 提供了丰富的线性代数功能,如矩阵乘法、求逆、特征值分解等。
5.1 矩阵乘法
NumPy 的 dot()
或 @
运算符可以执行矩阵乘法。
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])
result = np.dot(arr1, arr2) # 或 arr1 @ arr2
5.2 矩阵求逆
使用 np.linalg.inv()
计算矩阵的逆。
matrix = np.array([[1, 2], [3, 4]])
inverse_matrix = np.linalg.inv(matrix)
5.3 特征值和特征向量
np.linalg.eig()
可以计算矩阵的特征值和特征向量。
matrix = np.array([[1, 2], [2, 1]])
eigenvalues, eigenvectors = np.linalg.eig(matrix)
6. NumPy 的广播机制
广播机制允许对不同形状的数组进行数学运算,NumPy 自动将小数组扩展为大数组的形状以适应运算。这使得编写代码更加简洁高效。
示例代码
arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([1, 0, 1])
# 广播:arr2 自动扩展为 arr1 的形状
result = arr1 + arr2 # [[2, 2, 4], [5, 5, 7]]
7. NumPy 的高级操作
7.1 数组排序
NumPy 提供了 np.sort()
函数,可以对数组进行排序。
arr = np.array([3, 1, 2])
sorted_arr = np.sort(arr) # [1, 2, 3]
7.2 集合操作
NumPy 还提供集合操作,如 np.unique()
用于去除重复元素。
arr = np.array([1, 2, 2, 3, 3])
unique_arr = np.unique(arr) # [1, 2, 3]
8. NumPy 的性能优化
- 内存效率:
ndarray
是连续内存块,减少了 Python 列表带来的额外开销。 - **矢量化
操作**:NumPy 中的数组操作通常是矢量化的,基于底层 C 实现,避免了 Python 循环,极大提升性能。
9. NumPy 的应用领域
- 数据分析与科学计算:如 Pandas 的底层数组计算依赖 NumPy。
- 机器学习:作为深度学习框架(如 TensorFlow、PyTorch)的底层支持。
- 图像处理:通过操作像素矩阵进行图像增强、滤波等。
- 物理与工程仿真:用来模拟复杂的物理模型和工程系统。
通过 NumPy,你可以高效地进行各种科学计算与数据处理,它不仅简化了工作流程,还大大提升了计算的速度和效率,是 AI 和数据科学领域的基础工具。
结束语
Flutter是一个由Google开发的开源UI工具包,它可以让您在不同平台上创建高质量、美观的应用程序,而无需编写大量平台特定的代码。我将学习和深入研究Flutter的方方面面。从基础知识到高级技巧,从UI设计到性能优化,欢饮关注一起讨论学习,共同进入Flutter的精彩世界!