科学重温柯南TV版:基于B站视频数据分析
麻鸭,四年过去了,失踪人口回归。
第一篇就决定是你了。
看了柯南M27剧场版后,萌生了重温TV版的念头,但是1191集(截止24/8/26)的体量太恐怖了,遂取点巧,综合大V建议(知乎;公众号)和视频网站数据(B站),挑一些精彩剧集。这个套路跟很多拔草推荐原理没差,就是综合典型意见和大众数据。
知乎问答跟公众号不多说了,上图是个人认为总结的比较好的,如果自带属性,目的性很强,比如新兰党,黑鸡党,基德党,基本就够用了。其实知乎答案也有爬啦,但从追剧角度看价值不大,只头部信息量足,直接看知乎前面几条就行。
重点说下B站数据吧(网址:https://www.bilibili.com/bangumi/play/ep323085),还是数据分析常规流程,数据获取——处理——分析。数据获取用的八爪鱼,基本没咋处理,分析用的帆软BI(网址:https://pcdemo.finebi.com/webroot/decision/link/UYHU)。
爬取整理后的数据如下,重要参考指标:点赞数、收藏数、投币数,由于三者相关性较强,主要看点赞数。
前两集的点赞数、投币数、收藏数远远高于其他,B站用户通病了,先三连,以后再看,为了作图和谐,可以将异常值屏蔽处理。
接下来思路很明确了,哪些剧集的点赞数最多,就是重温重点!
先看个100多集吧,图中显示有14%的剧集点赞量6k+,6k就是一个合适的点赞量分界线。
再看下这100多集的分布,基本集中在前200集,柯南早期集集经典诚不欺人,当然,呈现这般分布可能也与B站用户追剧习惯有关,追个头尾。
具体是哪些剧集呢?做了一个简单的筛选,点赞数最高的基本就是那些耳熟能详的经典案件,靠谱!
其实这个数据还有很多可供挖掘的地方,比如高赞的很多都是多集的系列,是不是集数越多,制作就越精良呢?还有后面的高人气剧集基本都与基德、主线有关,这是不是剧作组的重要参考卖点呢?