✨机器学习笔记(一)—— 监督学习和无监督学习
1️⃣ 监督学习(supervised learning)
✨ 两种主要类型的监督学习问题:
回归(regression):predict a number in infinitely many possible outputs.
分类(classification):predict categories in small number of possible outputs.
通过学习已经标记好的 (input, output) 正确对,让机器学会一个从输入到输出的映射关系,最终让机器利用映射关系(x to y mappings)只接受输入 x 而无需输出标签 y,给出输出的合理预测 y ^ \hat{y} y^。
🎈Regression:Housing price prediction
可以让通过机器通过不同的拟合函数来根据 House size 来预测 Price。
🎈Classification:Breast cancer detection
根据 Tumor size 和 Age 的数据组,机器需要学习必须决定如何将边界线拟合到数据上的算法,来帮助判断肿瘤是恶性还是良性。
2️⃣ 无监督学习(unsupervised learning)
聚类(clustering):it places the unlabeled data into different clusters.
监督学习是机器通过已经标记好的正确答案来学习进行预测,而无监督学习则是机器学习未标记的数据来自己发现其中的数据(比如聚类)。
机器通过学习未标记的样本数据来处理问题,称之为无监督学习,“监督”的意思可以直观理解为“是否有标注的数据”。
🎈Clustering:Grouping customer
机器通过无监督学习可以对客户的行为进行分组,针对性的提供服务。