【数据分析预备】Numpy入门
Jupyter Notebook
- 是一个基于网页的交互式计算环境
- 编写代码、运行代码、查看输出、可视化数据、分享报告文档
- 按单元格运行代码
- 可展示的信息格式更丰富(支持Markdown和Latex)
- 交互式运行环境
安装
- cmd窗口
pip install notebook
- 启动
jupyter notebook
- 退出
Ctrl+C
启动后网页界面如下
New一个Python3文件即可得到ipynb文件
- 分享
File-Download as
# Markdown
- 格式比纯文本更丰富
- 体积比富文本更轻量
两个库
NumPy: Numerical Python
核心数据结构: ND array n维数组
数据类型统一,执行效率高
- 安装
cmd
pip install numpy
报错
解决:切换到python安装目录
输入python -m install numpy
使用
列表转换为数组
import numpy as np
arr1 = np.array([[1, 2, 3], [4, 5, 6]]) # 二维数组
# 维度
print(arr1.ndim)
# 元组,各个维度元素的个数
print(arr1.shape)
# 元素总个数
print(arr1.size)
# 数组元素的类型
print(arr1.dtype)
#其他创建数组方法
print(np.zeros(3))
print(np.ones(3))
# 元素为数字序列
np.arange(5, 10, 2)
#连接数组
np.concatenate([np.zeros(2), np.ones(4)])
list1 = np.array([5, 17, 3, 26, 31])
sorted_list1 = sorted(list1) # 不改变list1,等同于np.sort(list1)
print(sorted_list1)
print(list1)
list1.sort() # 什么都不返回,改变原始列表
print(list1)
# 用索引获得元素
list1[0:3]
# 数组间运算=向量运算
import math
#聚合操作
list1.max()
list1.sum()
list1.mean()
#广播机制
list1[list1 > 6]
# 逻辑运算
list1[(list1 > 6)&(list1 < 30)]