好用的五个python表格自动化工具,谁都可以复制直接用
wptr33 2025-06-15 19:46 29 浏览
引言
在之前文章中,有一篇《这五个办公室常用自动化工具我用python帮你写好了,复制代码就能用》,没想到受到了广大读者的喜爱。
其中进行了一个投票,总结发现很多读者对于 excel 的自动化需求非常高,
投票结果
因此,本次再推出五个实用的、针对表格的代码,直接复制可以用!
1、excel提取图片
完整代码
import os
import zipfile
import shutil
import argparse
def extract_images_from_xlsx(xlsx_file_path, output_folder):
if not os.path.exists(output_folder) and not os.path.isdir(output_folder):
os.makedirs(output_folder)
extend = os.path.splitext(xlsx_file_path)[1]
if extend != '.xlsx' and extend != '.xls':
return
file_name = os.path.basename(xlsx_file_path)
new_xlsx_file_path = os.path.join(output_folder, file_name)
shutil.copy(xlsx_file_path, new_xlsx_file_path)
zip_name = f"{file_name.split('.')[0]}.zip"
new_zip_file_path = os.path.join(output_folder, zip_name)
os.rename(new_xlsx_file_path, new_zip_file_path)
extract_folder = os.path.join(output_folder, 'files')
with zipfile.ZipFile(new_zip_file_path, 'r') as f:
for files in f.namelist():
f.extract(files, extract_folder)
os.remove(new_zip_file_path)
media_path = f'{extract_folder}/xl/media/'
image_file_list = os.listdir(media_path)
for image_file in image_file_list:
image_path = os.path.join(media_path, image_file)
new_image_path = os.path.join(output_folder, image_file)
shutil.copy(image_path, new_image_path)
shutil.rmtree(extract_folder)
if __name__ == '__main__':
parser = argparse.ArgumentParser(
prog='excel图片提取',
description='提取excel中的所有图片',
)
parser.add_argument('-p', '--path', type=str, help='excel文件路径')
parser.add_argument('-o', '--output', type=str, help='导出图片文件夹')
args = parser.parse_args()
path = args.path
output = args.output if args.output is not None else '未命名文件夹'
if path is None:
print('缺失excel路径')
elif not path.endswith('.xlsx') and not path.endswith('.xls'):
print('不是excel文件')
else:
print('开始提取...')
extract_images_from_xlsx(path, output)
调用信息
usage: excel图片提取 [-h] [-p PATH] [-o OUTPUT]
提取excel中的所有图片
options:
-h, --help show this help message and exit
-p PATH, --path PATH excel文件路径
-o OUTPUT, --output OUTPUT 导出图片文件夹
调用示例
python xx.py -p excel路径
2、通过txt修改指定内容
安装库
pip install openpyxl
完整代码
import argparse
import openpyxl
def update_excel_with_txt(excel_path, txt_path):
with open(txt_path, 'r', encoding='utf-8') as file:
updates = dict(line.strip().split(':') for line in file if ':' in line)
wb = openpyxl.load_workbook(excel_path)
sheet_names = wb.sheetnames
for sheet_name in sheet_names:
sheet = wb[sheet_name]
for row in sheet.iter_rows():
for cell in row:
if cell.value in updates:
cell.value = updates[cell.value]
wb.save(excel_path)
if __name__ == '__main__':
parser = argparse.ArgumentParser(
prog='excel替换关键字',
description='通过txt将excel中相应关键字做替换',
)
parser.add_argument('-p', '--path', type=str, help='excel文件路径')
parser.add_argument('-t', '--txt', type=str, help='关键字txt文件')
args = parser.parse_args()
path = args.path
txt_path = args.txt
if path is None:
print('缺失excel路径')
elif not path.endswith('.xlsx'):
print('不是excel文件')
elif not txt_path.endswith('.txt'):
print('关键字不是txt文件')
else:
print('开始替换...')
update_excel_with_txt(path, txt_path)
调用信息
usage: excel替换关键字 [-h] [-p PATH] [-t TXT]
通过txt将excel中相应关键字做替换
options:
-h, --help show this help message and exit
-p PATH, --path PATH excel文件路径
-t TXT, --txt TXT 关键字txt文件
调用示例
python xx.py -p excel路径 -t 关键字txt路径
关键字文本样例
关键字txt
注意:请使用英文的冒号。
3、excel内容导入mysql
本案例代码不直接导入数据库,而是输出一份 导入文件,可以通过 导入文件 快捷导入到数据库中。
安装库
pip install openpyxl
完整代码
import argparse
import openpyxl
def excel_sql_output(excel_path, table_name, output_path):
wb = openpyxl.load_workbook(excel_path)
sheet = wb.active
columns = []
columns_names = ''
with open(output_path, 'w', encoding='utf-8') as f:
for i, row in enumerate(sheet.iter_rows(values_only=True)):
if i == 0:
columns = [v for v in row]
columns_names = ','.join(columns)
else:
values = []
for v in row:
if isinstance(v, str):
values.append(f"'{v}'")
elif v is None:
continue
else:
values.append(str(v))
if len(values) != len(columns):
continue
values = ','.join(values)
insert_sql = f'INSERT INTO {table_name} ({columns_names}) VALUES ({values});\n'
f.write(insert_sql)
wb.close()
if __name__ == '__main__':
parser = argparse.ArgumentParser(
prog='excel导出sql插入文件',
description='通过excel导出mysql数据库的插入sql文件,进行数据库快速导入',
)
parser.add_argument('-p', '--path', type=str, help='excel文件路径')
parser.add_argument('-t', '--table', type=str, help='对应数据库的表名')
parser.add_argument('-o', '--output', type=str, help='导出sql文件')
args = parser.parse_args()
path = args.path
table = args.table
output = args.output if args.output is not None else 'import.sql'
if path is None:
print('缺失excel路径')
elif not path.endswith('.xlsx'):
print('不是excel文件')
elif table is None:
print('表名必填')
else:
print('开始导出...')
excel_sql_output(path, table, output)
调用信息
usage: excel导出sql插入文件 [-h] [-p PATH] [-t TABLE] [-o OUTPUT]
通过excel导出mysql数据库的插入sql文件,进行数据库快速导入
options:
-h, --help show this help message and exit
-p PATH, --path PATH excel文件路径
-t TABLE, --table TABLE
对应数据库的表名
-o OUTPUT, --output OUTPUT
导出sql文件
调用示例
python xx.py -p excel文件 -t 表名
excel示例
excel样例
请将数据放于 第一个数据表,并根据数据库的样式 修正标题。
4、excel双表查重
安装库
pip install pandas
完整代码
import argparse
import pandas as pd
def merge(excel_1_path, excel_2_path, column_1='', colum_2='', join='left'):
df1 = pd.read_excel(excel_1_path)
df2 = pd.read_excel(excel_2_path)
if join == 'left':
duplicates = df1[df1[column_1].isin(df2[colum_2])]
elif join == 'right':
duplicates = df2[df2[colum_2].isin(df1[column_1])]
else:
duplicates = pd.merge(df1, df2, on=[column_1, colum_2], how='inner')
output_file = 'export.xlsx'
duplicates.to_excel(output_file, index=True)
if __name__ == '__main__':
parser = argparse.ArgumentParser(
prog='双表查重',
description='通过两个表格进行重复数据查询',
)
parser.add_argument('-p1', '--path1', type=str, help='excel表1路径')
parser.add_argument('-p2', '--path2', type=str, help='excel表2路径')
parser.add_argument('-c1', '--column1', type=str, help='表1列名')
parser.add_argument('-c2', '--column2', type=str, help='表2列名')
parser.add_argument('-j', '--join', type=str, help='输出结果 left 左表 right 右表 merge 合并,默认left')
args = parser.parse_args()
path1 = args.path1
path2 = args.path2
column1 = args.column1
column2 = args.column2
join = args.join if args.join is not None else 'left'
if path1 is None or path2 is None:
print('缺失excel路径')
elif not path1.endswith('.xlsx') and not path2.endswith('.xlsx'):
print('不是excel文件')
elif column1 is None and column2 is None:
print('列名必填')
else:
print('开始查询...')
merge(path1, path2, column1, column2, join)
调用信息
usage: 双表查重 [-h] [-p1 PATH1] [-p2 PATH2] [-c1 COLUMN1] [-c2 COLUMN2] [-j JOIN]
通过两个表格进行重复数据查询
options:
-h, --help show this help message and exit
-p1 PATH1, --path1 PATH1
excel表1路径
-p2 PATH2, --path2 PATH2
excel表2路径
-c1 COLUMN1, --column1 COLUMN1
表1列名
-c2 COLUMN2, --column2 COLUMN2
表2列名
-j JOIN, --join JOIN 输出结果 left 左表 right 右表 merge 合并,默认left
调用示例
python xx.py -p1 表1 -p2 表2 -c1 表1列名 -c2 表2列名
请确保数据在 第一个数据表。
5、excel多表指定列求和
安装库
pip install pandas
完整代码
import argparse
import os
import pandas as pd
def table_sum(excel_folder, column):
file_list = os.listdir(excel_folder)
total = 0
for file in file_list:
if not file.endswith('.xlsx') and not file.endswith('.xls'):
continue
excel_path = os.path.join(excel_folder, file)
df = pd.read_excel(excel_path)
sum_value = df[column].sum()
total += sum_value
print(f'计算结果:{total}')
if __name__ == '__main__':
parser = argparse.ArgumentParser(
prog='多表求和',
description='通过放置excel的文件夹,求出相应列的总和',
)
parser.add_argument('-p', '--path', type=str, help='excel表文件夹')
parser.add_argument('-c', '--column', type=str, help='列名')
args = parser.parse_args()
path = args.path
column = args.column
if path is None:
print('缺失excel文件夹路径')
elif not os.path.isdir(path):
print('不是文件夹')
elif column is None:
print('列名必填')
else:
print('开始计算...')
table_sum(path, column)
调用信息
usage: 多表求和 [-h] [-p PATH] [-c COLUMN]
通过放置excel的文件夹,求出相应列的总和
options:
-h, --help show this help message and exit
-p PATH, --path PATH excel表文件夹
-c COLUMN, --column COLUMN
列名
调用示例
python xx.py -p 表格文件夹 -c 列名
请确保数据在 第一个数据表。
结尾
今天分享的五个表格自动化代码已经全部在上面啦!如果你喜欢本文,请点赞告诉我哦!
相关推荐
- MySQL进阶五之自动读写分离mysql-proxy
-
自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...
- 3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?
-
引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...
- 一文由浅入深带你完全掌握MySQL的锁机制原理与应用
-
本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...
- 验证Mysql中联合索引的最左匹配原则
-
后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...
- MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)
-
目录1.索引基础...
- 你会看 MySQL 的执行计划(EXPLAIN)吗?
-
SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...
- MySQL 从入门到精通(四)之索引结构
-
索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...
- mysql总结——面试中最常问到的知识点
-
mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...
- mysql总结——面试中最常问到的知识点(2)
-
首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...
- MySQL基础全知全解!超详细无废话!轻松上手~
-
本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...
- 深入剖析 MySQL 中的锁机制原理_mysql 锁详解
-
在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...
- Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析
-
引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...
- MySQL基础篇:DQL数据查询操作_mysql 查
-
一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...
- MySql:索引的基本使用_mysql索引的使用和原理
-
一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
程序员的开源月刊《HelloGitHub》第 71 期
-
详细介绍一下Redis的Watch机制,可以利用Watch机制来做什么?
-
假如有100W个用户抢一张票,除了负载均衡办法,怎么支持高并发?
-
Java面试必考问题:什么是乐观锁与悲观锁
-
如何将AI助手接入微信(打开ai手机助手)
-
redission YYDS spring boot redission 使用
-
SparkSQL——DataFrame的创建与使用
-
一文带你了解Redis与Memcached? redis与memcached的区别
-
如何利用Redis进行事务处理呢? 如何利用redis进行事务处理呢英文
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)