机器学习(4):机器学习项目步骤(一)——定义问题
1. 机器学习项目的五大步骤
定义问题
收集数据和预处理
选择算法和确定模型
训练拟合模型
评估优化模型性能
2. 定义问题的主要任务
刨析业务场景,设定清晰目标,同时还要确定当前问题属于哪一种机器学习类型。
3. “易速鲜花”项目案例
项目任务:对微信公众号推广文案的运营效率进行分析。
项目背景:收集了大量的软文数据,包括点赞数、转发数和浏览量等等。因为微信公众号阅读量超过 10 万之后,就不能显示它的具体阅读量了。
项目目标:建立机器学习模型,根据点赞数和转发数等指标,估计一篇文章能实现多大的浏览量。
【分析机器学习类型】:点赞数、转发数、热度指数、文章评级,这 4 个字段都是特征,浏览量就是标签。这里我们已经有要估计的标签了,所以这是一个监督学习问题。再加上我们的标签是连续性的数值,因此它是一个回归问题。