首页 存档 技术 查看内容

Python读取Excel文件统计演员参演电影

2018-3-30 13:00 |来自: 互联网 1537 0

摘要: 假设有个Excel 2007文件“电影导演演员.xlsx”,其中有三列分别为电影名称、导演和演员列表(同一个电影可能会有多个演员,每个演员姓名之间使用逗号分隔),现在要求统计每个演员的参演电影分别是哪些。 下面的代 ...

假设有个Excel 2007文件“电影导演演员.xlsx”,其中有三列分别为电影名称、导演和演员列表(同一个电影可能会有多个演员,每个演员姓名之间使用逗号分隔),现在要求统计每个演员的参演电影分别是哪些。

下面的代码使用到了扩展库openpyxl来读取xlsx文件,需要使用pip进行安装。

'''根据电影、导演、演员清单,统计每个演员的参演电影'''

import openpyxl

from openpyxl import Workbook


def getActors(filename):

actors = dict()

# 打开xlsx文件,并获取第一个worksheet

wb = openpyxl.load_workbook(filename)

ws = wb.worksheets[0]

# 遍历Excel文件中的所有行

for index, row in enumerate(ws.rows):

# 绕过第一行的表头

if index == 0:

continue

# 获取电影名称和演员列表

filmName, actor = row[0].value, row[2].value.split(',')

# 遍历该电影的所有演员,统计参演电影

for a in actor:

actors[a] = actors.get(a, set())

actors[a].add(filmName)

return actors


actors = getActors('电影导演演员.xlsx')

actors = sorted(actors.items(), key=lambda x:int(x[0][2:]))

for item in actors:

print(item)


代码执行结果为:


声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部