Python 数据持久化 - Openpyxl 模块
Microsoft 的 Excel 是最流行的电子表格应用程序。 它已经使用了 25 年多。 Excel 的更高版本使用 Office Open XML (OOXML) 文件格式。 因此,通过其他编程环境访问电子表格文件成为可能。
OOXML 是一种 ECMA 标准文件格式。 Python 的 openpyxl 包提供了读取/写入扩展名为 .xlsx 的 Excel 文件的功能。
openpyxl 包使用类似于 Microsoft Excel 术语的类命名法。 Excel 文档称为工作簿,在文件系统中以 .xlsx 扩展名保存。 一个工作簿可能有多个工作表。 工作表显示了一个大的单元格网格,每个单元格都可以存储值或公式。 形成网格的行和列已编号。 列由字母 A、B、C、...、Z、AA、AB 等标识。 行从 1 开始编号。
一个典型的 Excel 工作表如下所示 −
pip 实用程序足以安装 openpyxl 包。
pip install openpyxl
Workbook 类代表一个带有一张空白工作表的空工作簿。 我们需要激活它,以便可以将一些数据添加到工作表中。
from openpyxl import Workbook wb=Workbook() sheet1=wb.active sheet1.title='StudentList'
我们知道,工作表中的单元格被命名为 ColumnNameRownumber 格式。 因此,左上角的单元格是 A1。 我们将一个字符串分配给这个单元格 −
sheet1['A1']= 'Student List'
或者,使用工作表的 cell() 方法,该方法使用行号和列号来标识单元格。 调用 value 属性给单元格对象赋值。
cell1=sheet1.cell(row=1, column=1) cell1.value='Student List'
用数据填充工作表后,通过调用工作簿对象的 save() 方法保存工作簿。
wb.save('Student.xlsx')
此工作簿文件在当前工作目录中创建。
以下 Python 脚本将元组列表写入工作簿文档。 每个元组存储学生的 Name、age 和 marks。
from openpyxl import Workbook wb = Workbook() sheet1 = wb.active sheet1.title='Student List' sheet1.cell(column=1, row=1).value='Student List' studentlist=[('RollNo','Name', 'age', 'marks'),(1,'Juhi',20,100), (2,'dilip',20, 110) , (3,'jeevan',24,145)] for col in range(1,5): for row in range(1,5): sheet1.cell(column=col, row=1+row).value=studentlist[row-1][col-1] wb.save('students.xlsx')
工作簿 students.xlsx 保存在当前工作目录中。 如果使用 Excel 应用程序打开,则显示如下 −
openpyxl 模块提供了load_workbook() 函数来帮助读取工作簿文档中的数据。
from openpyxl import load_workbook wb=load_workbook('students.xlsx')
您现在可以访问由行号和列号指定的任何单元格的值。
cell1=sheet1.cell(row=1, column=1) print (cell1.value) Student List
示例
以下代码使用工作表数据填充列表。
from openpyxl import load_workbook wb=load_workbook('students.xlsx') sheet1 = wb['Student List'] studentlist=[] for row in range(1,5): stud=[] for col in range(1,5): val=sheet1.cell(column=col, row=1+row).value stud.append(val) studentlist.append(tuple(stud)) print (studentlist)
输出
[('RollNo', 'Name', 'age', 'marks'), (1, 'Juhi', 20, 100), (2, 'dilip', 20, 110), (3, 'jeevan', 24, 145)]
Excel 应用程序的一个非常重要的特性是公式。 要为单元格分配公式,请将其分配给包含 Excel 公式语法的字符串。 将 AVERAGE 函数分配给具有年龄的 c6 单元格。
sheet1['C6']= 'AVERAGE(C3:C5)'
Openpyxl 模块具有 Translate_formula() 函数,可在一定范围内复制公式。 以下程序在 C6 中定义了 AVERAGE 函数,并将其复制到 C7 中计算平均分数。
from openpyxl import load_workbook wb=load_workbook('students.xlsx') sheet1 = wb['Student List'] from openpyxl.formula.translate import Translator#copy formula sheet1['B6']='Average' sheet1['C6']='=AVERAGE(C3:C5)' sheet1['D6'] = Translator('=AVERAGE(C3:C5)', origin="C6").translate_formula("D6") wb.save('students.xlsx')
更改后的工作表现在显示如下 −