【50 Pandas+Pyecharts | 暑期档电影票房数据分析可视化】
文章目录
- 🏳️🌈 1. 导入模块
- 🏳️🌈 2. Pandas数据处理
- 2.1 读取数据
- 2.2 提取电影名称
- 🏳️🌈 3. Pyecharts数据可视化
- 3.1 电影总票房排行
- 3.2 各电影票房占比
- 3.3 2023中国各省地区大学数量分布
- 3.4 《抓娃娃》每日票房/观看人次
- 3.5 当日票房冠军电影次数
- 3.6 票房环比-场次环比-人次环比-平均票价
- 3.7 《抓娃娃》《云边有个小卖部》各城市等级电影票房
- 🏳️🌈 4. 可视化项目源码+数据
大家好,我是 👉【Python当打之年(点击跳转)】
本期将利用Python分析「2024暑期档电影票房数据」 ,看看:电影整体票行排行分布情况、哪部电影人气最高观看人数最多以及平均票价,票房环比等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
涉及到的库:
Pandas — 数据处理
Pyecharts — 数据可视化
🏳️🌈 1. 导入模块
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
🏳️🌈 2. Pandas数据处理
2.1 读取数据
df1 = pd.read_excel('./data/各地域票房分布.xlsx')
df2 = pd.read_excel('./data/总票房详情.xlsx')
df3 = pd.read_excel('./data/每日票房详情.xlsx')
2.2 提取电影名称
df3['电影名称'] = df3['当日票房冠军'].apply(lambda x: x.split('¥')[0].strip() if '¥' in x else None)
🏳️🌈 3. Pyecharts数据可视化
3.1 电影总票房排行
def get_bar1():
chart = (
Bar(i)
.add_xaxis(x_data[::-1])
.add_yaxis('', y_data[::-1])
.reversal_axis()
.set_global_opts(
title_opts=opts.TitleOpts(
title='1-电影总票房排行',
subtitle=subtitle,
pos_top='2%',
pos_left='center',
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
max_=20,
),
)
)
- 《抓娃娃》以32.56亿票房高居暑期票房榜榜首
- 《默杀》以13.51亿位居第二,《末路狂花钱》、《异形:夺命舰》、《云边有个小卖部》分别以7.82亿、6.43亿、4.99亿紧随其后
3.2 各电影票房占比
def get_pie1():
pie1 = (
Pie()
.add('',
[list(z) for z in zip(x_data, y_data)],
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='2-各电影票房占比',
subtitle=subtitle,
pos_top='4%',
pos_left='center',
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
max_=20,
),
)
)
- 《抓娃娃》占比37.96%
- 《默杀》占比15.75%
- 《末路狂花钱》占比9.12%
- 《异形:夺命舰》占比7.5%
- 《云边有个小卖部》占比5.82%
3.3 2023中国各省地区大学数量分布
- 《抓娃娃》共7867.9万人次观看
- 《默杀》共3280.11万人次观看
- 《末路狂花钱》共1951.86万人次观看
- 《异形:夺命舰》共1586.25万人次观看
- 《云边有个小卖部》共1232.3万人次观看
3.4 《抓娃娃》每日票房/观看人次
- 《抓娃娃》在7月20日(上映后第一个周末)票房达到单日顶峰3.7亿,当日共901万人次观看,此后每周末都是一个小高峰
- 7月16日前为点映数据
3.5 当日票房冠军电影次数
- 《抓娃娃》占据单日票房榜32天
- 《异形:夺命舰》占据单日票房榜15天
- 《云边有个小卖部》占据单日票房榜11天
- 《默杀》占据单日票房榜10天
- 《我才不要和你做朋友呢》占据单日票房榜9天
3.6 票房环比-场次环比-人次环比-平均票价
3.7 《抓娃娃》《云边有个小卖部》各城市等级电影票房
def get_pie2():
pie1 = (
Pie()
.add('',
[list(z) for z in zip(x_data, y_data1)],
)
.add('',
[list(z) for z in zip(x_data, y_data2)],
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='《抓娃娃》《云边有个小卖部》各城市等级电影票房',
subtitle=subtitle,
pos_top='4%',
pos_left='center',
),
)
)
- 《抓娃娃》、《云边有个小卖部》在二线城市票房最高,占比接近40%,一线城市票房占比12%左右,三线城市票房占比20%左右,四线城市票房占比20%左右,其他城市票房占比8%左右
🏳️🌈 4. 可视化项目源码+数据
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。