# python_final **Repository Path**: NFUNM001/python_final ## Basic Information - **Project Name**: python_final - **Description**: No description available - **Primary Language**: HTML/CSS - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-07-18 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README | 发布日期 | 2020-07-23 | | --- | --- | | 项目名称 | 豆瓣电影排行榜分析| | 项目现状 | 完成 | | 项目所有者 | 蔡晓晨 | | 项目设计师 | 蔡晓晨 | | 项目开发者 | 蔡晓晨 | | 项目测试者 | 蔡晓晨 | # 项目名称——豆瓣电影排行榜分析 # 项目介绍和MVP价值主张宣言 * 本项目根据挖掘到的豆瓣电影top250电影名称、电影描述、评论人数、电影基本信息、电影排名及电影评分的的数据进行分析,得出现如今观众喜欢什么类型的电影,优秀电影主要出自于哪些国家,进而可以帮助从事影视行业的人士更好地选择投资。 ### 问题表述 1.数据分析项目为啥要做? 随着大量资本涌入电影市场,院线电影像雨后春笋般地生长,市场竞争激烈,根据豆瓣电影排行榜进行分析,可以帮助投资方选择更符合市场需求的电影进行投资。 2.是谁有需要解决的问题? 电影投资方想要在电影市场分一杯羹,投资一部电影数额不小,收益和风险相关,如果有对受观众欢迎的电影的分析,会对投资方的投资有所帮助。 * 用户画像:电影公司投资人,负责寻找有投资价值的项目 ### 解决方案表述 1.数据分析项目如何做分析? 在挖掘到源数据后,通过数据整理、数据清洗、数据重塑完成对源数据的清洗,在清洗完数据后提取到自己所需的内容行,并对内容进行构图分析。 2.分析成果如何解决谁的问题? 解决电影投资方的问题,分析成果有助于电影投资方更合理地投资,降低风险。 ### 数据分析思路及方法 * 具体用户需求 结合jupyter和pyecharts的特性,pyecharts在jupyter中可以快速的使用并展现图表内容并进行交互。 * 数据分析思路及方法 pyecharts是一款将python与echarts结合的强大的数据可视化工具,简单的几行代码就可以将数据进行非常好看的可视化,而且还是动态的。基本步骤为导入相关图表包、进行图表的基础设置,创建图表对象、利用add()方法进行数据输入与图表设置(可以使用print_echarts_options()来输出所有可配置项)、利用render()方法来进行图表保存。 ### 数据分析流程及成果 * 具体用户需求 pyecharts的图表的图表简洁明了,使用简单,不需要操作经验即可使用,有助于用户理解内容。 * 数据分析流程及成果 数据分析的过程耗时久,在使用pyecharts的过程中会出现因为某个参数的缺失报错,而花费时间修改代码,解决问题,然后进行图表交互后了解到数据分析的结果内容,成果中可以看出排行榜前250部电影大部分都是美国的,美国电影业繁荣,美国电影全球化传播策略是美国电影发展中的一个重要组成部分。进入20世纪90年代,好莱坞全球化已经成为一种现象, 它强大的资本助推力,市场占有率和文化影响力覆盖了全世界。美国电影年产量约为世界电影产量的十分之一,但占据世界电影票房的70%。投资电影较好的选择依然是美国的专业公司团队。 # 数据分析描述 ### 数据源 * 源数据:[豆瓣电影top250](https://gitee.com/NFUNM001/python_final/blob/master/douban.tsv) * 内容包括对电影的简短描述/电影在豆瓣中的评论人数/电影上映年份/国家/电影类型/电影名称/电影在豆瓣的排名/电影的评分 ![](https://images.gitee.com/uploads/images/2020/0718/220858_8c094e2f_1532315.png) ### 数据分析目标 主要分析的目标数据:豆瓣评分排行榜前250部电影所属的国家分布以及电影类型占比 数据整理、清洗、重塑的数据流介绍: ![流程图](https://images.gitee.com/uploads/images/2020/0718/220857_f217e4bb_1532315.png) ## 数据分析结果价值宣言 * 最终目标带来的分析价值:通过了解到豆瓣评分排行榜前250部电影类型占比可以得知现如今消费者喜欢什么类型的电影,进而可以帮助从事影视行业的人士更好地选择投资。 * 加值:电影公司拍摄出更符合市场的影视作品,提高市场竞争力,获得巨额票房。 ### 数据分析结果可视化 * 使用到的可视化模块介绍 pyecharts柱状图/饼状图/世界地图 * 可视化模块的具体API介绍 pyecharts是一款将python与echarts结合的强大的数据可视化工具,简单的几行代码就可以将数据进行非常好看的可视化,而且还是动态的。基本步骤为导入相关图表包、进行图表的基础设置,创建图表对象、利用add()方法进行数据输入与图表设置(可以使用print_echarts_options()来输出所有可配置项)、利用render()方法来进行图表保存。 * 预计可视化展示的结果以及数据故事的阐述 柱状图会展示在豆瓣排行榜上各个类型的上榜电影数量;世界地图中,会展示各个国家上榜的电影。饼状图会展示在豆瓣排行榜前250部的电影类型的占比。主要使用数据进行分析大受欢迎的电影主要是哪些类型的,以及这些电影主要来自于哪些国家,可以给电影公司和其他影视行业从业人员一些发展的方向,有利于提高投资电影的票房收入。 # 数据分析电子档/ipynb文档 - [ipynb档](https://gitee.com/NFUNM001/python_final/blob/master/Untitled.ipynb) - [豆瓣TOP250国家分布交互图](https://gitee.com/NFUNM001/python_final/blob/master/%E4%BA%A4%E4%BA%92.html) - [电影类型分布图](https://gitee.com/NFUNM001/python_final/blob/master/%E4%BA%A4%E4%BA%92.html) ### 交互图需先下载再查看 # 主要项目作品方案 ### 数据分析结果的基本的对比图 ![独角兽国家地区交互图](https://images.gitee.com/uploads/images/2020/0718/220858_97565f22_1532315.png) - [豆瓣TOP250国家分布交互图下载链接](https://gitee.com/NFUNM001/python_final/blob/master/%E4%BA%A4%E4%BA%92.html) ![电影类型分布图](https://images.gitee.com/uploads/images/2020/0718/220900_714ed393_1532315.png) - [电影类型分布图下载链接](https://gitee.com/NFUNM001/python_final/blob/master/%E4%BA%A4%E4%BA%92.html) 从电影类型分布图中可以发现,最受欢迎的电影类型是剧情片,然后是喜剧片和动作片,剧情片的节奏往往比较的慢,但是情节相对紧凑,往往是一种社会现象和一定人群的生活状态的写照,容易使观看者产生情感上的共鸣,客观反映出观众逐渐喜欢看一些贴近自己生活的电影。 ## 数据分析结果的时空交互 ![豆瓣TOP250国家分布交互图](https://images.gitee.com/uploads/images/2020/0718/220858_97565f22_1532315.png) - [豆瓣TOP250国家分布交互图下载链接](https://gitee.com/NFUNM001/python_final/blob/master/%E4%BA%A4%E4%BA%92.html) ## 数据分析结果的地图 - 从静态图中可以看出,首先可以看出在豆瓣排行榜前250名的电影主要分布在北美、南美、亚洲以及大洋洲。 - 数量最多的国家为美国,美国电影全球化传播策略是美国电影发展中的一个重要组成部分。进入20世纪90年代,好莱坞全球化已经成为一种现象, 它强大的资本助推力,市场占有率和文化影响力覆盖了全世界。美国电影年产量约为世界电影产量的十分之一,但占据世界电影票房的70%。 - 数据分析最后的结果证明,美国的好评电影数量遥遥领先其他国家,而且还在继续输出,中国电影的进步空间还很大。 ![豆瓣TOP250国家分布交互图](https://images.gitee.com/uploads/images/2020/0718/220858_97565f22_1532315.png) - [豆瓣TOP250国家分布交互图下载链接](https://gitee.com/NFUNM001/python_final/blob/master/%E4%BA%A4%E4%BA%92.html) ## 学习/实践心得总结及感谢 在学期pandas课程中,学习了如何清洗和整合数据,经过本次项目的实践过后,对pyecharts的图表的使用更加的得心应手,分析数据讲故事的能力也在提升。做项目,敲代码,找数据,讲故事都是工多手熟的过程,不断地碰壁,解决,进步。同时感谢许老师和廖老师的耐心指导以及给予的代码,还有一些不厌其烦帮助我的同学。 ## 参考url [豆瓣排行榜top250](https://movie.douban.com/top250) [pyecharts绘制各种图表详细(代码)](https://blog.csdn.net/qq_31967985/article/details/79975663)