机器学习实战学习笔记:前言与准备
个人学习介绍
- 该专栏作为《机器学习实战(原书第三版)》的读书笔记,涉及对书本内容的理解和书本内容原有的示例和部分原文。
- 略懂一点点python语法
- 编程环境选用python 3.12.1 ,IDE为 DataSpell (主要)(Pycharm/jupyter lab/jupyter notebook 少用)
前言
Python框架
以下是三个Python框架的介绍以及相应的时间和官方文档地址:
1. Scikit-Learn
- 介绍:Scikit-Learn(简称sklearn)是一个开源的Python机器学习库,建立在NumPy、SciPy、Pandas和Matplotlib之上,提供了简单而高效的工具用于数据挖掘和数据分析。它涵盖了机器学习中的样例数据、数据预处理、模型验证、特征选择、分类、回归、聚类、降维等几乎所有环节。
- 时间线:
- 2007年:Scikit-learn最初由David Cournapeau在Google的夏季代码项目中开发。
- 2010年:法国计算机科学与自动化研究所INRIA参与其中,并发布了第一个公开版本(v0.1 beta)。
- 2022年12月:发布scikit-learn 1.2.0版本。
- 官方文档地址:Scikit-Learn Official Documentation
2. TensorFlow
- 介绍:TensorFlow是一个由Google开发的开源机器学习框架,广泛用于数据流图的数值计算。它允许开发者灵活地构建模型,并在多种平台上运行,包括CPU、GPU和TPU(张量处理单元)。TensorFlow提供了高级API,如Keras,使得构建和训练模型更加简单。
- 时间线:TensorFlow最初发布于2015年11月。
- 官方文档地址:TensorFlow Official Documentation
3. Keras
- 介绍:Keras是一个用Python编写的高级神经网络API,它能够以TensorFlow、CNTK或Theano作为后端运行。Keras的开发重点是支持快速的实验,允许简单而快速的原型设计,并且同时支持卷积神经网络和循环神经网络,以及两者的组合。
- 时间线:Keras最初发布于2015年。
- 官方文档地址:Keras Official Documentation
这些框架都是Python在机器学习和深度学习领域中非常重要的工具,各自有着广泛的应用和社区支持。
这些框架都是Python在机器学习和深度学习领域中非常重要的工具,各自有着广泛的应用和社区支持。
基本的库
当然,以下是三个Python库的介绍以及它们的官方文档地址:
1. NumPy
- 介绍:NumPy(Numeric Python的缩写)是一个开源的Python科学计算库,用于进行大规模数值和矩阵运算。它提供了一个高性能的多维数组对象
ndarray
以及用于操作这些数组的工具和函数,是许多其他科学计算和数据分析库(如Pandas和SciPy)的基础。 - 官方文档地址:NumPy Official Documentation
2. Pandas
- 介绍:Pandas是一个开源的数据分析和操作库,它提供了快速、灵活以及表达力强的数据结构,旨在使“关系”或“标签”数据的操作既简单又直观。它的核心数据结构是DataFrame和Series,可以被看作是带有标签的列式和行式数据结构。
- 官方文档地址:Pandas Official Documentation
3. Matplotlib
- 介绍:Matplotlib是一个用于创建静态、交互式以及动画可视化的Python库。它提供了一个类似于MATLAB的绘图框架,使得创建高质量2D图表变得简单。Matplotlib可以与多种GUI库一起使用,如Tkinter、GTK、Qt等。
- 官方文档地址:Matplotlib Official Documentation
这三个库是Python数据科学和科学计算领域中不可或缺的工具,它们共同为数据分析、科学计算和数据可视化提供了强大的支持。
全书路线介绍
- 机器学习部分——基础
- 深度学习部分——深刻
机器学习竞赛网站