基于python的体育新闻数据可视化及分析
项目 :北京冬奥会体育新闻数据可视化及分析
摘 要
随着社会的不断进步与发展,新时代下的网络媒体获取的信息也更加庞大和繁杂,相比于传统信息来源更加难以分析和辨别,造成了新时代媒体从业者撰写新闻的难度。在此背景下,与时俱进的采用信息化手段,基于计算机技术的信息化分析方法,采用数据挖掘等技术,从各方面获取新闻信息,之后通过计算机软件进行研究与分析[4],并输出分析结果,进而对人们的筛选、决策等活动提供辅助,能够在很大程度上提高媒体从业者的工作效率[5],提升媒体从业者决策的精准度。因此,在此领域研究大数据时代下网络媒体冬奥会新闻的可视化分析方法[6],实现冬奥会新闻信息化数据分析,十分有必要。。
本次设计以冬奥会为研究对象将采用Pandas的数据处理方法和PyEcharts的可视化显示。首先针对各个国家的参赛成绩进行统计,通过PyEcharts的柱状图对各个国家的参赛成绩进行显示,分别通过不同颜色显示不同国家和地区的金牌、银牌和铜牌数量,并对其进行排序除了以图表的形式对冬奥会数据进行展示外,还可以应用文本词语的频率统计,采用词云的形式对网络媒体体育新闻数据的高频词进行展示。。
关键词:msyql;信息;python;新闻热点;可视化
1网站功能结构图
本设计还可以利用Python wordcloud包进行词云生成,选取针对冬奥会的热点话题数据挖掘结果进行展示,得到词云结果。其他单词随着频率的变化显示样式也会发生相应的变化,进而为冬奥会数据分析从业者挖掘热点话题提供了便利,进一步提升了大数据时代下网络媒体体育新闻可视化的水平。之后,采用Pandas的数据处理方法和PyEcharts的可视化显示对各类奖牌获取比例进行分析,并显示其水滴图,显示内容分别为对获得金牌的运动员比例、获得奖牌的运动员比例、获得金牌中国运动员比例以及获得奖牌中国运动员的比例进行统计,并显示为水滴图。通过这些数据分析将以可视化展示出冬奥会数据
本系统预计是一个基于PYthon的北京冬奥会体育新闻数据可视化及分析的开发。通过对网站系统需求的调查研究,确定网站系统应该对不同的用户提供不同的功能。本系统主要功能结构如下所示。
pyhoen 爬取:头条新闻数据。 新闻:分类,新闻名,新闻内容,点击率、热度 之类的数据。
WEB 用Django框架
后台:管理新闻数据。管理评论。
前台:用户注册,登录,查看新闻。搜索新闻,可以评论新闻。也可以发布新闻。