当前位置: 首页 > article >正文

大数据应用对企业的价值

目录

一、大数据应用价值

1.1 大数据技术分析

1.2 原有技术场景的优化

1.2.1 数据分析优化

1.2.2 高并发数据处理

1.3 通过大数据构建新需求

1.3.1 智能推荐

1.3.2 广告系统

1.3.3 产品/流程优化

1.3.4 异常检测

1.3.5 智能管理

1.3.6 人工智能和机器学习

二、大数据应用价值分析

2.1 数据分析的价值

2.2 大数据技术性能的价值

2.3 构建新需求的价值

三、什么情况下不需要大数据岗位

四、结语


前言:这几年互联网寒冬,时常听到大数据工作者担忧,大数据是开发支持岗位,担心公司业务收缩,先裁大数据岗位;这从侧面说明大数据应用在公司没有体现出该有的价值,大数据应用有哪些价值?为什么没有实现大数据的价值?本文从这两个视角分析。

一、大数据应用价值

       最近几年,到处都能听到大数据这个词,比如大数据推荐,大数据分析,大数据挖掘等;仿佛用大数据这个词就能解释很多没有关联的事;但是大数据到底有哪些应用价值,却没有清晰认识。 一些企业和部门怀着对大数据的期盼,引入了大数据技术开发解决应用场景,发现带来的价值不如预期;大数据的核心特性,是对大数据量的处理能力。什么场景需要,处理能力能干什么?

       对于很多单位或者企业,会有这样的疑惑。笔身深耕在大数据应用一线,从使用者的角度去总结和分析大数据带来的价值,如果无法分析到尽善尽美,希望大家谅解和补充。

上一章基于企业和大数据应用做了详细分析。大数据企业应用场景分析-CSDN博客

1.1 大数据技术分析

      大数据技术就像个新的土地,如何基于新土地优化原有或者构建新东西,大体方向从这两个维度去思考。对于原有技术场景的优化,数据分析、高并发数据处理属于这类;智能推荐、产品/流程优化、异常检测、智能管理、人工智能和机器学习属于第二类,通过大数据技术构建新东西。

1.2 原有技术场景的优化

1.2.1 数据分析优化

       在大数据技术出现以前,数据分析通常在OLTP数据库之上,写SQL用数据库自带引擎做数据分析,数据存储瓶颈分表分库解决,计算性能也得不到保障;大数据技术出现以后,对于业务的分析,可以统一通过数仓产出,且可以跨业务关联分析;除此之外,由于大数据本身的处理能力,以前无法做到的,比如通过日志,或者更细节的埋点分析,都可以通过大数据技术做到业务支持。

对于数据分析的应用优化,这里总结出3个点:

  • 代替OLTP数据库做业务指标计算
  • 解决数据孤岛,跨业务关联分析计算指标
  • 对业务系统运行,构建更细粒度的用户行为分析
1.2.2 高并发数据处理

       在大数据技术出现以前,对于提高业务性能的需求,基本是通过多线程高并发的方式实现,大数据技术将许多高并发的业务场景,简化成几个配置选项,对于一些数据采集、数据处理、数据分析,多数数据驱动的场景,使用大数据技术,能极大的提升业务的性能。

对于数据处理的应用需求,用牺牲部分灵活性的代价,极大的提升了数据处理的性能。

1.3 通过大数据构建新需求

       在大数据技术出现以前,受限于技术性能,许多需求是不合理;得益于大数据技术的出现,可以在高性能的基础上构建一些有价值的新需求,比如产品智能推荐、广告系统、产品/流程优化、异常检测、智能管理、人工智能和机器学习等。

1.3.1 智能推荐

        对于面向市场的产品,内容媒体定制化推荐,能实现更好的用户体验,比如新闻媒体、视屏号等;这些需求要在极快的时间做到人群划分和媒体内容划分,使用大数据技术,实现快速的搜索和准确的推荐功能,交互性能往往在秒级;这样的产品,能在应用市场占据很大的份额。

1.3.2 广告系统

       在巨大的市场用户面前,广告需要满足推荐的精准分析和高效推荐;这需要对产品用户数据的智能管理和分析提出很高的技术要求,和智能推荐的技术架构场景类似,需求场景不同。

1.3.3 产品/流程优化

       这里优化有两个过程,第一个是发现需要优化的部分,第二个是使用大数据技术优化局部性能;比如对于高QPS、快速搜索、快速计算的数据库,使用大数据技术,可以提高业务性能,最简单的场景,将Mysql的详情数据写入ES,使用ES的API提供数据支撑,数据量越大,性能对比效果越好。

1.3.4 异常检测

       得益于大数据技术的数据处理能力,实时性和TPS,对于业务、物联网设备、中间件、产品安全等多种场景,可以使用大数据技术作为核心架构,构建起高效的异常检测系统,为多种场景的安全和运维护航,这对于业务和系统的安全与稳定有很好的作用。

1.3.5 智能管理

       笔者所在的公司,面向市场有上百万的PC电脑,对电脑资产的监控和管理一直是个痛点问题;在APP上埋点SDK工具,使用大数据技术作为采集和分析驱动,定时采集PC状态,将资产信息实时同步到业务系统,很快和稳定的构建起资产管理。

1.3.6 人工智能和机器学习

       对于多数公司,这个应用都是没有落地场景的,但是还是要提一下,大数据和算法的交互:数据特征工程;大数据数据采集、存储和治理是人工智能和机器学习的基石,这个价值按照业界的话来说,价值巨大但落地周期长,在一些基础算法分类、预测、决策的场景经常配合大数据能力一同使用。

二、大数据应用价值分析

对于不同的应用需求,价值的评估角度是不一样的。

2.1 数据分析的价值

       对于数据分析,第一指标的价值,能体现出来的决策支持有效性就是其价值;这需要深入理解业务,并提取出第一性重要性指标,从这个角度,数据开发只是提供大数据的能力支撑,核心是数据分析对业务的理解和指标重要性的评估。

      有些人觉得大数据是业务支持岗位,缺少业务价值,没有岗位安全感;这可能需要从指标的价值上去呈现,大数据应该比业务更理解业务,从中提取出有价值的信息,而不是单独的计算PV、UV这种状态指标,分析指标的变化关系和原因,这是更深一层的价值。

2.2 大数据技术性能的价值

       对于传统后端中间件的性能,已经无法服务大业务场景的需求,引入大数据组件,可以如同之前操作OLTP数据库一样一样,写简单的DSL语句完成业务需求;这依赖了大数据产品的高性能,这一层价值是产品赋予的,是大数据工作者的大数据解决方案。

2.3 构建新需求的价值

       大数据除了数据分析,还能基于大数据技术栈的特新,构建新需求,这些需求的价值,有增加用户体验的智能推荐,或者广告系统,或可以减轻运维压力,或智能异常检查,或安全工程师的风险管理,资产运维等。从大数据技术的视角,这些只能通过大数据技术性能实现的需求,才是大数据工作岗的护城河。

比如智能推荐:需要实现对大量用户的精细化管理,对人群和内容标签分类,对标签人群的快速搜索,对标签内容的快速推荐,这需要极高的接口QPS和搜索推荐性能;这些都是大数据技术擅长的;

比如智能运维:需要实时捕捉大量业务系统、中间件、主机、终端、移动端、供应商等运行的实时日志,实时监控各种系统的稳定性,并对各个模块做到智能检测管理,这是用到了大数据实时吞吐和快速计算检测的能力特性。

比如风险检测:对系统或者终端网络等的安全管理,需要实时监测捕捉大量运行数据,且面对实时变换的风险特征持续更新和增加,这些也依赖大数据技术的高吞吐性能和实时计算能力。

智能管理这些功能类似;

人工智能和机器学习:这些需要依靠大数据的处理能力,替算法构建特征模型,使用算法的能力做分析、决策和预测等应用。

三、什么情况下不需要大数据岗位

       时常在想,为什么大数据岗位有安全感担忧。可能和领导对大数据的期盼有关;

在引入大数据岗位的时候,往往希望大数据能带来有价值的决策支撑,然后落地之后才发现常规的PV/UV计算只能计算指标状态,BI等对决策支撑力度不够,这需要数据分析师赋能;

并且大数据数据库可以直接给后端使用,对应的数据库提供了API接口,可以跳过大数据开发,后端开发者可以直接使用,大数据岗位在中间只做了集成需求,这种岗位需求也不高;

除此之外,数据中台、应用中台的开发,偏向于后端开发,对大数据技术的需求并没有那么大;

这些场景,小数据量的维度计算、对大数据产品的应用、数据中台产品的开发,这些都是对大数据技术的要求没有那么强的要求。

四、结语

       大数据是新的技术生态,技术就是工具,工具就是用来解决问题;对于已有的应用场景,大数据技术提供新的解决方案;对于大数据技术优秀的性能,可以构建新的业务需求;上文提到的应用和应用价值只是思考方向,对于更多的可能性,需要从真实应用需求中挖掘。


http://www.kler.cn/a/234965.html

相关文章:

  • 基于层次化设计方法,设计一个16位二进制全加器
  • 数据版本管理和迁移工具Flyway用法最简说明
  • 【自用】通信内网部署rzgxxt项目_01,后端pipeDemo部署(使用nssm.exe仿照nohup)
  • 【docker】如何打包前端并运行
  • 2025.01.15python商业数据分析top2
  • 【Linux进程】进程间的通信
  • 《二叉树》——4(Leetcode题目练习)
  • ChatGPT升级至GPT-4 Turbo:性能升级同时更为经济
  • 根据三维点坐标使用matplotlib绘制路径轨迹
  • 使用R语言fifer包进行分层采样
  • 大语言模型不适合的范围
  • 推荐一款开源的跨平台划词翻译和OCR翻译软件:Pot
  • 《巴菲特给年轻人的人生忠告》读书笔记 + 个人思考
  • 测试开发体系
  • 大数据领域的数据仓库
  • 兼容性测试
  • 【Spring框架】Spring事务的原理
  • 计算机视觉讲座PPT分享
  • 机器学习:过拟合和欠拟合的介绍与解决方法
  • Unity类银河恶魔城学习记录6-2 P66 Clone‘s Attack源代码
  • 计算机网络——06分组延时、丢失和吞吐量
  • 编程中“游戏心切”心态的影响及其对策探讨
  • 3.10 Binance_interface APP U本位合约交易-市单价平仓
  • 第三节课[LangChain]作业
  • Java 数据结构篇-实现二叉搜索树的核心方法
  • 面试经典150题——三数之和