机器学习《西瓜书》学习笔记《待续》
如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。
目录
- 绪论
- 引言
- 基本术语
- 扩展
- 向量的张成-span
- 使用Markdown语法编写数学公式
- 希腊字母的LaTex语法
- 插入一些数学的结构
- 插入定界符
- 插入一些可变大小的符号
- 插入一些函数名称
- 插入二进制运算符和关系运算符
- 插入箭头符号
- 上下标
- 输出矩阵
- 输出分段函数
- 字体
绪论
引言
为什么我们通过色泽青绿
,根蒂蜷缩
,敲声捉响
就能判断是好瓜?
因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个特征我们就可以做出相当好的判断。类似的,我们从以往的学习经验知道,下足了功夫、弄清了概念、做好了作业
,自然会取得好成绩。
可以看出,我们能做出有效的判断,是因为我们已经积累了许多经验
,而通过对已有经验的利用,就能对新的情况做出有效的决策!!
上面对经验的利用是靠我们人类自身完成的,计算机能帮忙吗?
机器学习致力于研究如何通过计算的手段,利用经验
来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生“模型(model)”的算法
,即“学习算法”(learningalgorithm)
。有了学习算法,我们把经验数据提供给它,它就能基于这些算法产生模型,在面对新的情况时,模型会给我们提供相应的判断。如果说,计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。
基本术语
要进行机器学习,先要有数据,假定我们收集的的一批关于西瓜的数据,例如:
色泽 | 根蒂 | 敲声 |
---|---|---|
青绿 | 蜷缩 | 浊响 |
乌黑 | 稍蜷 | 沉闷 |
浅白 | 硬挺 | 清脆 |
… | … | … |
每行数据都是一条记录,这组记录的集合称为一个“数据集(dataset)”
,每条记录是关于一个事件或对象(这里是西瓜对象instance)的描述,成为一个“实例(instance)”或“样本(sample)”
。
反应事件或对象在某方面的表现或性质的项,如“色泽”,“根蒂”,“敲声”,称为“属性(attribute)”或“特征(feature)”
。属性的取值,如“青绿”,“乌黑”,称为”属性值(attribute value)“
。
属性张成的空间称为”属性空间(attribute space)“、”样本空间(sample space)“或”输入空间(input space)”。
例如,把“色泽”,“根蒂”,“敲声”作为三个坐标轴,则它们的张成一个用于描述西瓜的三维空间,每个西瓜都可以在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此也把一个instance称为一个“特征向量(feature vector)”
一般地,令 D = {x1, x2, … , xm} 表示包含 m 个示例的数据集,每个instance由 d 个属性描述(例如上面的西瓜数据使用了 3 个属性),则每个实例xi = (xi1; xi2; … ; xid) 是 d 维样本空间 X 中的一个向量,xi∈X,其中 xij
是
xi在第j个属性上的取值(例如上述第 3 个西瓜在第 2 个属性上的值是"硬挺" ) , d 称为样本xi的"维数(dimensionality)
。
从数据中学得模型的过程称为"学习"(learning)或"训练"(training)
, 这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为"训练数据" (training data)
, 其中每个样本称为一个"训练样本" (training sample)
, 训练样本组成的集合称为"训练集"(training set)
.
扩展
向量的张成-span
使用Markdown语法编写数学公式
Markdown语法编写数学公式和LaTex有异曲同工之妙。(LaTex入门,LaTex公式手册)
在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:
在Markdown中编写数学公式通常使用LaTeX语法。对于渲染数学公式的Markdown编辑器(如GitHub、Jupyter Notebook、MathJax支持的环境等),可以使用以下两种方式编写数学公式:
行内公式使用单个美元符号 $
包裹 LaTeX 公式,表示行内公式:
这是行内公式,例如:$E = mc^2$
这是行内公式,例如: E = m c 2 E = mc^2 E=mc2
块级公式使用双美元符号 $$
包裹 LaTeX 公式,表示块级公式(独立成行):
这是块级公式:
$$
E = mc^2
$$
渲染后效果,这是块级公式:
E
=
m
c
2
E = mc^2
E=mc2
复杂的数学公式
贝叶斯定理:
$$
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
$$
渲染后效果:贝叶斯定理:
P
(
A
∣
B
)
=
P
(
B
∣
A
)
P
(
A
)
P
(
B
)
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
P(A∣B)=P(B)P(B∣A)P(A)
常见数学符号:
- 分数:
\frac{a}{b}
- 幂:
a^b
- 下标:
a_b
- 求和:
\sum
- 积分:
\int
注意事项:
- 并不是所有的Markdown编辑器都支持数学公式渲染,你可以检查是否支持MathJax或者KaTeX。
- GitHub Markdown 不直接支持数学公式,需要额外的插件或工具。
希腊字母的LaTex语法
插入一些数学的结构
插入定界符
将上述定界符与\left和right组合使用可以使得定界符匹配其内容的高度,比如要构建一个如下的矩阵的行列式:
$$
\left|\begin{matrix}
a & b & c \\
d & e & f \\
g & h & i
\end{matrix} \right|
$$
显示效果如下:
∣ a b c d e f g h i ∣ \left|\begin{matrix} a & b & c \\ d & e & f \\ g & h & i \end{matrix} \right| adgbehcfi
插入一些可变大小的符号
插入一些函数名称
插入二进制运算符和关系运算符
插入箭头符号
上下标
可以使用^来输出上标,使用_来输出下标,使用{}包含作用范围。
$$
\sin^2(\theta) + \cos^2(\theta) = 1
$$
$$
\sum_{n=1}^\infty k
$$
$$
\int_a^bf(x)\,dx
$$
$$
\lim\limits_{x\to\infty}\exp(-x) = 0
$$
sin 2 ( θ ) + cos 2 ( θ ) = 1 \sin^2(\theta) + \cos^2(\theta) = 1 sin2(θ)+cos2(θ)=1
∑ n = 1 ∞ k \sum_{n=1}^\infty k n=1∑∞k
∫ a b f ( x ) d x \int_a^bf(x)\,dx ∫abf(x)dx
lim x → ∞ exp ( − x ) = 0 \lim\limits_{x\to\infty}\exp(-x) = 0 x→∞limexp(−x)=0
输出矩阵
矩阵中的各元素通过用$来分隔,\来换行。
$$
\begin{matrix}
0&1&2\\
3&4&5\\
6&7&8\\
\end{matrix}
$$
0 1 2 3 4 5 6 7 8 \begin{matrix} 0&1&2\\ 3&4&5\\ 6&7&8\\ \end{matrix} 036147258
输出分段函数
用\begin{cases}和\end{cases}来构造分段函数,中间则用\来分段:
$$
f(x) =
\begin{cases}
2x,\,\,x>0\\
3x,\,\,x\le0\\
\end{cases}
$$
f ( x ) = { 2 x , x > 0 3 x , x ≤ 0 f(x) = \begin{cases} 2x,\,\,x>0\\ 3x,\,\,x\le0\\ \end{cases} f(x)={2x,x>03x,x≤0
字体
$\mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathcal{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathfrak{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathsf{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123
$\mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123}$
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c 123 \mathbb{ABCDEFGHIJKLMNOPQRSTUVWXYZabc123} ABCDEFGHIJKLMNOPQRSTUVWXYZabc123