当前位置: 首页 > article >正文

AIGC基础工具-科学计算和数据处理的重要库NumPy(Numerical Python)简介

在这里插入图片描述

文章目录

      • 1. NumPy 的核心概念
        • 1.1 `ndarray`:多维数组对象
          • 示例代码
      • 2. NumPy 的数据类型 (`dtype`)
          • 示例代码
      • 3. NumPy 的数组创建方法
        • 3.1 使用 `array()` 创建数组
        • 3.2 使用 `zeros()` 和 `ones()`
        • 3.3 使用 `arange()` 和 `linspace()`
        • 3.4 使用 `random` 模块生成随机数组
      • 4. NumPy 数组操作
        • 4.1 数组切片和索引
        • 4.2 数组的形状变化
        • 4.3 数学运算
        • 4.4 数学函数
          • 示例代码
      • 5. NumPy 的线性代数功能
        • 5.1 矩阵乘法
        • 5.2 矩阵求逆
        • 5.3 特征值和特征向量
      • 6. NumPy 的广播机制
          • 示例代码
      • 7. NumPy 的高级操作
        • 7.1 数组排序
        • 7.2 集合操作
      • 8. NumPy 的性能优化
      • 9. NumPy 的应用领域

NumPy 是 Python 科学计算和数据处理的重要库之一,全称为 Numerical Python。它为多维数组(ndarray)和矩阵提供了支持,并且拥有大量高效的数学函数和操作。NumPy 是机器学习、深度学习和数据科学中的基础工具之一,也是其他库如 Pandas、SciPy、Matplotlib、TensorFlow 等的核心构件。

1. NumPy 的核心概念

1.1 ndarray:多维数组对象

NumPy 中最重要的对象是 ndarray,它是用于存储同类型数据的多维数组。与 Python 原生列表相比,ndarray 更加高效,特别是在处理大型数据集时。ndarray 具有以下重要属性:

  • ndim:数组的维度数(轴数)。
  • shape:数组的形状,返回一个元组,表示每个维度中元素的个数。
  • size:数组的元素总数。
  • dtype:数组中元素的数据类型。
  • itemsize:每个数组元素所占用的字节数。
示例代码
import numpy as np
# 创建一个 2x3 的 ndarray
arr = np.array([[1, 2, 3], [4, 5, 6]])

print("数组维度:", arr.ndim)
print("数组形状:", arr.shape)
print("数组元素总数:", arr.size)
print("数组数据类型:", arr.dtype)
print("每个元素占用的字节数:", arr.itemsize)

2. NumPy 的数据类型 (dtype)

NumPy 支持多种数据类型,比 Python 的内置数据类型更加丰富和细粒度。例如:

  • int8, int16, int32, int64:分别表示 8、16、32、64 位整数。
  • float16, float32, float64:表示 16、32、64 位浮点数。
  • complex64, complex128:分别表示 64 位、128 位的复数。

你可以在创建数组时指定数据类型,也可以通过 astype() 方法将数组转换为其他类型。

示例代码
arr_float = np.array([1.5, 2.5, 3.5], dtype=np.float32)
arr_int = arr_float.astype(np.int32)
print(arr_int)

3. NumPy 的数组创建方法

NumPy 提供了多种创建数组的方式,除了直接通过列表或元组,还可以通过函数生成特定形状、数值范围的数组。

3.1 使用 array() 创建数组

从 Python 列表、元组等数据结构直接转换为数组。

arr = np.array([1, 2, 3, 4])
3.2 使用 zeros()ones()

创建全 0 或全 1 的数组,常用于初始化数组。

zeros_array = np.zeros((3, 3))  # 3x3 的全 0 数组
ones_array = np.ones((2, 4))    # 2x4 的全 1 数组
3.3 使用 arange()linspace()
  • arange(start, stop, step):返回一个在指定范围内按步长生成的等差数组。
  • linspace(start, stop, num):返回一个在指定范围内生成的等间距的浮点数数组。
arr_range = np.arange(0, 10, 2)  # [0, 2, 4, 6, 8]
arr_linspace = np.linspace(0, 1, 5)  # [0. , 0.25, 0.5, 0.75, 1. ]
3.4 使用 random 模块生成随机数组

NumPy 的 random 模块可以生成随机数数组,如服从正态分布的随机数或 0 到 1 之间的随机浮点数。

random_array = np.random.rand(3, 3)  # 3x3 的随机浮点数矩阵
normal_array = np.random.randn(3, 3)  # 3x3 的正态分布随机数矩阵

4. NumPy 数组操作

4.1 数组切片和索引

NumPy 支持类似 Python 列表的切片和索引操作,但可以对多维数组进行切片。

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[0, 2])  # 访问第一行第三个元素
print(arr[:, 1])  # 访问所有行的第二列
print(arr[1:3, :])  # 切片:获取第 2 行到第 3 行的所有列
4.2 数组的形状变化

使用 reshape() 可以改变数组的形状,但前提是总元素个数不变。ravel()flatten() 可以将数组展开为一维。

arr = np.array([[1, 2, 3], [4, 5, 6]])
reshaped = arr.reshape(3, 2)  # 变成 3 行 2 列
flattened = arr.ravel()  # 展平为一维数组
4.3 数学运算

NumPy 支持数组之间的元素级运算,如加法、减法、乘法和除法,运算速度非常快。

arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

sum_arr = arr1 + arr2  # [5, 7, 9]
mul_arr = arr1 * arr2  # [4, 10, 18]
4.4 数学函数

NumPy 提供了大量数学函数,如:

  • np.sin()np.cos()np.tan():三角函数。
  • np.exp()np.log():指数和对数函数。
  • np.sqrt():开平方。
示例代码
arr = np.array([1, 4, 9])
sqrt_arr = np.sqrt(arr)  # [1. 2. 3.]

5. NumPy 的线性代数功能

NumPy 提供了丰富的线性代数功能,如矩阵乘法、求逆、特征值分解等。

5.1 矩阵乘法

NumPy 的 dot()@ 运算符可以执行矩阵乘法。

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

result = np.dot(arr1, arr2)  # 或 arr1 @ arr2
5.2 矩阵求逆

使用 np.linalg.inv() 计算矩阵的逆。

matrix = np.array([[1, 2], [3, 4]])
inverse_matrix = np.linalg.inv(matrix)
5.3 特征值和特征向量

np.linalg.eig() 可以计算矩阵的特征值和特征向量。

matrix = np.array([[1, 2], [2, 1]])
eigenvalues, eigenvectors = np.linalg.eig(matrix)

6. NumPy 的广播机制

广播机制允许对不同形状的数组进行数学运算,NumPy 自动将小数组扩展为大数组的形状以适应运算。这使得编写代码更加简洁高效。

示例代码
arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([1, 0, 1])

# 广播:arr2 自动扩展为 arr1 的形状
result = arr1 + arr2  # [[2, 2, 4], [5, 5, 7]]

7. NumPy 的高级操作

7.1 数组排序

NumPy 提供了 np.sort() 函数,可以对数组进行排序。

arr = np.array([3, 1, 2])
sorted_arr = np.sort(arr)  # [1, 2, 3]
7.2 集合操作

NumPy 还提供集合操作,如 np.unique() 用于去除重复元素。

arr = np.array([1, 2, 2, 3, 3])
unique_arr = np.unique(arr)  # [1, 2, 3]

8. NumPy 的性能优化

  • 内存效率ndarray 是连续内存块,减少了 Python 列表带来的额外开销。
  • **矢量化

操作**:NumPy 中的数组操作通常是矢量化的,基于底层 C 实现,避免了 Python 循环,极大提升性能。

9. NumPy 的应用领域

  • 数据分析与科学计算:如 Pandas 的底层数组计算依赖 NumPy。
  • 机器学习:作为深度学习框架(如 TensorFlow、PyTorch)的底层支持。
  • 图像处理:通过操作像素矩阵进行图像增强、滤波等。
  • 物理与工程仿真:用来模拟复杂的物理模型和工程系统。

通过 NumPy,你可以高效地进行各种科学计算与数据处理,它不仅简化了工作流程,还大大提升了计算的速度和效率,是 AI 和数据科学领域的基础工具。


结束语
Flutter是一个由Google开发的开源UI工具包,它可以让您在不同平台上创建高质量、美观的应用程序,而无需编写大量平台特定的代码。我将学习和深入研究Flutter的方方面面。从基础知识到高级技巧,从UI设计到性能优化,欢饮关注一起讨论学习,共同进入Flutter的精彩世界!


http://www.kler.cn/a/318259.html

相关文章:

  • layui.all.js:2 Uncaught Error: Syntax error, unrecognized expression
  • Spring——事务
  • golang使用etcd版本问题
  • 华为云前台用户可挂载数据盘和系统盘是怎么做到的?
  • (六)Spark大数据开发实战:豆瓣电影数据处理与分析(scala版)
  • 封装一个省市区的筛选组件
  • hbase merge工具
  • 【C++】list容器的基本使用
  • 项目小总结
  • 后台管理系统开箱即用的组件库!!【送源码】
  • 在视频上绘制区域:使用Vue和JavaScript实现交互式画布
  • Leetcode 第 415 场周赛题解
  • 科大讯飞智能体Python SDK接入流程
  • 矩阵快速幂
  • 【Android】模糊搜索与数据处理
  • 鸿萌数据恢复服务: 修复 Windows, Mac, 手机中 “SD 卡无法读取”错误
  • Parallels Desktop 20(Mac虚拟机) v20.0.0 for Mac 最新破解版(支持M系列)
  • 江协科技STM32学习- P18 实验-PWM输入捕获测频率PWMI输入捕获模式测频率和占空比
  • QT Creator cmake 自定义项目结构, 编译输出目录指定
  • C++ STL容器(三) —— 迭代器底层剖析
  • BFS 解决最短路问题(C++)
  • Vue3操作DOM元素
  • C++信奥老师解一本通题 1164:digit函数
  • 【每日一题】LeetCode 2207.字符串中最多数目的子序列(贪心、字符串、前缀和)
  • 基于深度学习的能源消耗预测
  • linux-vim的使用