专项练习-数据思维-49题
※食用指南:文章内容为牛客网《专项练习-数据思维》49道选择题,重点笔记,用于重复思考错题,加深印象
练习传送门:专项练习-数据思维-49题
目录:
1、战略分析方法
2、矩阵式管理
3、箱形图(Box-plot)
4、AARRR模型
5、RFM模型
6、数据分析模型
7、制定指标遵循的原则
8、建立指标体系
9、业务的指标体系
10、用户相关的指标
11、流量类评估指标
12、推广付费指标
13、游戏的数据分析指标
14、运营指标中效率指标
15、数据思维
16、4P营销理论
17、评估市场规模
18、分类算法
19、K-Means算法
20、大数据的4V特征
21、数据预处理
22、编写数据报告的一般流程
23、数据分析报告
24、报表制作流程
25、数据监控指标
26、波动种类
27、4种存储途径
1、战略分析方法
①波士顿矩阵(BCG Matrix)
在拟定每个产品的发展战略时,主要考虑的是它的:
市场占有率:是以某种产品的市场份额与市场上最大竞争对手的份额比率来表示
市场增长率:一般以销售增长率表示,它是指企业前后两年产品市场的销售额增长的百分比
四种不同性质的产品类型,形成不同的产品发展前景:
①明星类产品:市场增长率和市场占有率“双高”的产品群
②瘦狗类产品:市场增长率和市场占有率“双低”的产品群
③问题类产品:市场增长率高、市场占有率低的产品群
④金牛类产品:市场增长率低、市场占有率高的产品群
企业良性发展的业务发展方向:问题→明星→金牛
企业良性发展的现金流发展方向:金牛→明星→问题
②杜邦分析法(DuPontysis):是利用几种主要的财务比率之间的关系来综合地分析企业的财务状况(评价公司盈利能力和股东权益回报水平)
③帕累托法则(二八法则):用于表示主要产出或报酬是由少数的原因、投入和努力所产生的(识别和优化关键业务领域、资源配置是否达到最佳状态、识别并优先处理重要的任务提高工作效率)
④SWOT分析法(态势分析法):是把组织内外环境所形成的机会(Opportunities),风险(Threats),优势(Strengths),劣势(Weaknesses),结合起来进行分析,以寻找制定适合组织实际情况的经营战略和策略的方法
2、矩阵式管理
矩阵式管理:常见的组织结构形式之一
①充分利用企业资源,避免人力资源过度浪费
②可避免各部门重复劳动,加强组织的整体性
③针对特定的任务进行人员配置,有利于发挥个体优势
3、箱形图(Box-plot)
箱型图:在数据可视化中能统计出单变量的离散程度,既能将数据的以及分布区间清晰直观地表现出来,又能突出异常数据值
主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较
组成部分:上边缘、下边缘、中位数和两个四分位数
常见于品质管理(以质量为中心,为全员参与为基础,目的在于通过让客户满意而达到长期成功的管理途径)
4、AARRR模型
用户生命周期:用户进入平台需经历的五个环节的典型的漏斗结构
Acquisition(获取)
Activation(激活)
Retention(留存)
Revenue(付费)
Refer(推荐/裂变)
5、RFM模型
Rencency(最近一次消费) | 客户在店铺消费最近一次和上一次的时间间隔,理论上R值越小的客户是价值越高的客户 |
Frequency(消费频率) | 客户在固定时间内的购买次数(一般是1年,通常替换成累计购买次数) |
Monetary(消费金额) | 所有数据库报告的支柱,显示出排名靠前的顾客所花费的金额,从而做出针对性活动 |
6、数据分析模型
类别 | 定义 | 方法 | 具体 | |
购物篮分析 (Market Basket Analysis) | 是一种数据挖掘技术,用于发现商品之间的关联性和规律,特别是在零售业中广泛应用 | 收集商品销售数据 | 识别潜在的商品组合或推荐搭配 | |
生成频繁项集 | ||||
推导出关联规则 | ||||
计算度量指标 | 支持度、置信度 | |||
漏斗分析 (Funnel Analysis) | 是一种通过跟踪用户在销售、营销或其他业务流程中的转化率,并识别转化率较低的阶段,以优化业务流程和提高转化率的方法 | 确定业务流程 | 记录每个阶段的转化量 | |
分析转化率 | ||||
采取相应措施 | 优化页面设计、改善用户体验 | |||
跟踪改进效果 | 评估措施的有效性,持续优化业务流程 | |||
留存分析 (Retention Analysis) | 是一种常用的数据分析方法,旨在了解用户或客户在不同时间段内的留存情况,特别是在移动应用和在线服务等领域中广泛使用 | 定义留存率 | 继续使用产品或服务的比例(日留存率、周留存率、月留存率) | |
计算留存率 | 用户或客户的留存情况(逐步留存、全量留存) | |||
分析留存率 | 使用问题、竞争对手进入、市场变化 | |||
顾客画像分析 (Customer Profiling Analysis) | 是一种利用统计学和数据挖掘技术,对顾客进行分析和分类的方法 | 收集数据 | 收集客户的基本信息,行为数据 | |
数据清洗和整理 | 去重、去异,将数据转化为结构化数据 | |||
数据分析 | 采用聚类分析、回归分析、关联规则挖掘等 | |||
生成顾客画像 | 基本信息、行为特征、偏好和需求等信息,可视化为图表、报告等 | |||
制定营销策略 | 提高客户的满意度和忠诚度,有助于增加营收和市场份额,优化产品设计和开发,提升企业竞争力 |
7、制定指标遵循的原则
SMART原则(Specific、Measurable、Attainable、Relevant、Time-bound)
具体的、可衡量、可量化、相关性、时间性
8、建立指标体系
①了解部门KPI(一级指标)
②了解业务运营情况I(二级指标)
③梳理业务流程I(三级指标)
④通过报表监控指标(不断更新指标体系)
9、业务的指标体系
①监控业务情况
②通过拆解指标寻找当前业务问题
③评估业务可改进的地方,找出下一步工作的方向
10、用户相关的指标
日新增用户:衡量新增用户使用的指标
留存率:评估用户产品功能对用户的粘性
活跃率:活跃用户数/总用户数
次日留存率:第2天的用户数/第1天新增的用户数
11、流量类评估指标
若某个网页1天被5个人打开50次
PV:50
UV:5
指标 | 定义 |
页面浏览量(PV) | 指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标 |
访客数(UV) | 是指一天之内到底有多少不同的用户访问了你的网站,能真实准确地反映用户数量 |
跳失率(BR) | 访问了某个项目一次就退出的次数和这个项目总访问的次数的比率,主要反映出该页面做得好不好,由此来提升网页的内容,促进产品的销售 |
点击率(CTR) | 被用户看到的次数,一般用来考核广告投放的引流效果 |
转化率(CVR) | 用户完成设定的转化环节的次数和总会话人数的百分比,通常用来评价一个转化环节的好坏 |
评估订单产生效率:
访问到下单的转化率(电商网站下单的次数与访问该网站的次数之比)
12、推广付费指标
类别 | 定义 |
CPC(Cost Per Click) | 按点击次数付费广告 |
CPD(Cost Per Download) | 按APP的下载数付费 |
CPS(Cost Per Sales) | 按完成购买的用户数 |
CPA(Cost Per Action) | 按投放的实际效果付费 |
13、游戏的数据分析指标
类型 | 定义 |
日活跃用户的平均收益(ARPDAU) | 获取新用户为目的的活动分析,产品ARPDAU值可以看出游戏中的哪个模块或设计具有最好的盈利能力 |
每付费用户平均收入(ARPU) | 有购买行为的用户的平均支出(收入) |
付费转化率 | 在一算时间里,有购买行为的玩家占玩家总数的比例 |
日活跃用户量(DAU) | 用于计算一天之内登陆或使用了APP的玩家数 |
14、运营指标中效率指标
①客单价(per customer transaction):销售额÷成交顾客数
②动销率:(商品累计销售SKU数量 ÷商品库存SKU数量)*100%
③连带率:销售总数量÷销售小票数量,指销售的件数和交易的次数相除后的数值,反映的是顾客平均单次消费的产品件数。
从传统零售的“货”为主到电商的“人-货-场”立体维度,管理者需要自上而下的系统性的规划监控不同指标
(售罄率 = 累计销售 ÷ 总进货)
15、数据思维
类型 | 定义 |
全数据思维 | 通过丰富、全面、多源、互补、互证的大数据,来构建研究对象的全面信息,探索对象之间客观联系的思维模型 |
准确性思维 | 缩小数据研究范围,不接受数据的混杂性、保证数据的准确性 |
相关性思维 | 量化和研究两个或多个数据值之间存在的数理关系 |
容错性思维 | 容许大数据中存在噪音、杂质、脏数据、混杂数据和错误数据 |
16、4P营销理论
四个基本策略的组合
产品 ( Product )、价格( Price )、促销( Promotion)、渠道(Place )
策略(Strategy)
4P’s
17、评估市场规模
①市场规模(市场容量)
主要是研究目标产品或行业的整体规模
目标产品或行业在指定时间的的产量、产值等
②行业集中度
研究行业的相关市场内前N家最大的企业所占市场份额总和
③市场趋势
指对一个或几个有确定意义的市场影响因素所做的持续反应,该持续反应表现为具有统计相关特征的价格序列
18、分类算法
决策树(Decision Tree):一种常用的机器学习算法,用于分类和回归问题
K近邻:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别
支持向量机(Support Vector Machine, SVM):是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面
19、K-Means算法
①属于无监督聚类算法
②必须先给定K值,即聚类的数目
③不同的K值得到的结果可能不一样
20、大数据的4V特征
特征 | 定义 | 目的 |
Volume(体量) | 规模巨大,数据量可以从几个太字节(TB)到艾字节(EB)、泽字节(ZB)甚至更大 | 需要特殊的工具和技术 |
Variety(多样性) | 类型繁多,包括网络日志、音频、视频、图片、地理位置等 (数据结构化、半结构化和非结构化) | 满足了不同场景和需求的数据处理 |
Velocity(速度) | 处理速度非常快,要求在秒级时间范围内给出分析结果,以满足实时性和智能化的需求 | 保持数据的价值和实时性 |
Value(价值密度低) | 大量数据中只有一小部分是有价值的 | 通过算法和技术提取出有价值的信息,实现数据的最大化利用 |
21、数据预处理
数据清洗 | 对数据集中的不完整、不合理或不准确的数据进行修补、去重、纠错、修补或删除 |
数据变换 | 将原始数据变换成符合目标算法要求的数据 |
数据集成 | 对来自不同的数据源的数据进行集成处理 |
22、编写数据报告的一般流程
①明确数据报告的需求及目的
②拆解指标发现问题
③拆解问题
④拓展维度探究指标差异
⑤撰写报告及美化
23、数据分析报告
最主要作用:决策者提供决策参考
评估数据分析报告是否合格:分析水平、分析结果、分析质量
24、报表制作流程
①需求分析,明确制作报表的目的是什么。
②建立指标体系,明确的指标体系能满足业务需求。
③设计展现形式,考虑如何展示数据,才能让业务部门更容易地理解数据。
④编写需求文档,说明报表原型、更新频率等信息,做好同步
⑤报表开发,沟通排期,跟进开发进度,验证报表的数据质量
25、数据监控指标
环比数据
同比数据
当天数据极值
每个环节的转换
26、波动种类
长期趋势:经济的发展方向
季节变动:一年内按季按月按周的一种小周期循环
循环变动:按较长时间的一个大周期变动(A股牛熊交替)
不规则变动:自然灾害,战争等黑天鹅因素
27、4种存储途径
分布式存储 | 通过网络使用企业中的每台机器上的磁盘空间,数据分散的存储在企业的各个角落 |
数据库存储 | 按照数据结构来组织、存储和管理数据的仓库 |
云储存 | 通过网络技术、分布式文件系统、服务器虚拟化、集群应用等技术讲网络中的海量的异构存储设备构成可弹性扩张、低成本、低能耗的共享存储资源池,共同对外提供数据存储和业务访问功能的一个系统 |
普通文档存储 | 将数据保存到普通文档中 |
————END