当前位置: 首页 > article >正文

Excel中批量替换字符大PK:Excel VS. Python

一、问题由来

聚会计划一些菜品,现根据实际需要把B列中一些菜品更换一些,替换成C列中的菜品,最终结果写到E列当中,如下图效果所示。

问题示意图

二、解决办法

本人经过思考,考虑到这是一个批量替换的问题,我们需要先找到更换的菜品,在原计划菜品中定位,然后更换为新菜品,手工复制粘贴极其麻烦,这时可以考虑在WPS当中使用substitutes进行批量替换。在Excel中没有stubstitutes这个函数,可以考虑使用vlookup函数。

如果是在线表格,还可以在WPS当中使用Python来解决这个问题。

1. substitutes函数

其语法是substitutes(目标数据列,原数据列,新数据列)

这是目标数据列是A2:A19,原数据列是B2:B4, 新数据列是C2:C4。

我们可以在E2中输入以下公式,回车即可:

=substitutes(A2:A19,B2:B4,C2:C4)

这种解法,思路清晰,操作简单,易不易记,推荐。当然如果B2:B4和C2:C4不在当前工作表,也可以跨表引用,这样可以实现数据的跨表分离,适用于进行大量数据的替换。

这里要注意的时,替换的内容不要重复,否则就会容易适成混乱。

2. vlookup函数法

在Excel中没有substitutes,只有substitute, 所以考虑可以使用iferror+vlookup的方法来解决这个问题。

首先要明确:

  • A列:聚会计划菜单
  • B列:原菜品
  • C列:替换菜品

假设您希望在 E列 中输出替换后的菜品,您可以使用以下公式:

=IFERROR(VLOOKUP(A2, B:C, 2, FALSE), A2)

公式解释:

A2:聚会计划菜单中的菜品(假设从 A2 开始)。

B:C:包含原菜品和替换菜品的表格区域。

数字2表示我们要从 B 和 C 列的第二列(即“替换菜品”列)提取替换菜品。

FALSE:确保精确匹配原菜品。

IFERROR:如果没有找到对应的替换菜品,则返回原菜品(即 A2)。

E2填写完后,再选中右下角十字,双击填充即可。

3. 在线Python法

最新的wps在线文档已经支持调用Python代码,我们可以使用以下代码实现。由于在线文档已经把常用的模块导入,所以我们不必导入pandas模块,直接写代码。

# 读取 Excel 数据
df = xl("$A$42:$A$59", headers=None, sheet_name="Sheet1")

replacement_dict = {}
for row in range(42, len(df)):
    original = df[row][1]  # 假设原菜品在第二列(索引为1)
    replacement = df[row][2]  # 假设替换菜品在第三列(索引为2)
    replacement_dict[original] = replacement
# 初始化起始写入位置
start_row = 42
print(replacement_dict)
for text in df[0]:  # 假设聚会计划菜单在第一列(索引为0)
    try:
        # 查找是否有对应的替换菜品
        if text in replacement_dict:
            new_text = replacement_dict[text]  # 如果有替换菜品,使用替换菜品
        else:
            new_text = text  # 否则保持原菜品
        write_xl(new_text,f"$E${start_row}",sheet_name="Sheet1")
    except Exception as e:
        # 发生错误时写入“查无此词”
        write_xl("查无此词", f"$B${start_row}", sheet_name="Sheet1")
    start_row+=1

Python的思路时,先读取表格,建立一个新旧菜名的字典,然后遍历A列,应用字典,再写入到指定列即可。

其中xl()是在wps中读取表的函数,write_xl是写入表的函数,这是与普通pandas模块不一样的。

4. 线下Python法

如果是线下python,就可以使用pandas模块来解决这个问题。通过读取you_file.xlsx文件,然后创建字典,替换后生成update_menu.xlsx。这种方法适用于数据量多的情况。如果替换的文件比较多,可以考虑把字典内容单独放,这样就变成了批量的读取字典,替换Excel文件的功能了。

import pandas as pd

# 读取Excel文件中的数据
df = pd.read_excel('your_file.xlsx', sheet_name='Sheet1')

# 假设您的Excel中有3列:聚会计划菜单、原菜品、替换菜品
# df.columns = ['聚会计划菜单', '原菜品', '替换菜品']

# 创建一个字典来映射原菜品到替换菜品
replacement_dict = dict(zip(df['原菜品'], df['替换菜品']))

# 假设在聚会计划菜单中需要替换的是原菜品
def replace_dishes(menu):
    # 如果菜单中的菜品在字典中找到,则替换为对应的替换菜品
    return replacement_dict.get(menu, menu)

# 假设您的菜单数据存储在 "聚会计划菜单" 这一列
df['聚会计划菜单'] = df['聚会计划菜单'].apply(replace_dishes)

# 将更新后的DataFrame保存到新的Excel文件
df.to_excel('updated_menu.xlsx', index=False, sheet_name='UpdatedSheet')

三、学后总结

1. 不同场景需要的不同的解决办法,不同的方法各有优劣。WPS中用substitutes, Excel中用vlookup,如果数据量较大,可以考虑用python。

2. 在数据量较少的情况下,wps的公式甚至比py执行效率还高。但是如果是几十个文件,替换的内容成百上千时,用线下的python代码进行替换就方便了。

3. 这是一个菜品替换小项目,如果换成翻译中的术语替换,也可以采用同样的操作,推荐使用substitutes,因为这个函数简单易于理解。


http://www.kler.cn/a/403739.html

相关文章:

  • Linux 服务器使用指南:从入门到登录
  • 私域四步走:打造你的专属流量池
  • 三种复制只有阅读权限的飞书网络文档的方法
  • 集合卡尔曼滤波(Ensemble Kalman Filter),用于二维滤波(模拟平面上的目标跟踪),MATLAB代码
  • iPhone 17 Air看点汇总:薄至6mm 刷新苹果轻薄纪录
  • ubuntu用bind9自建DNS服务器时logging日志出现failed: permission denied解决方法
  • c ++零基础可视化——vector
  • WebSocket详解、WebSocket入门案例
  • React渲染流程与更新diff算法
  • AMD(Xilinx) FPGA配置Flash大小选择
  • Linux:权限相关知识详解
  • 基于yolov8、yolov5的茶叶等级检测识别系统(含UI界面、训练好的模型、Python代码、数据集)
  • hhdb数据库介绍(9-26)
  • 当mysql的slave无法同步master数据时,如何基本不断业务重置主从同步关系
  • MySQL社区版的启动与连接
  • 数据集-目标检测系列- 花卉 鸡蛋花 检测数据集 frangipani >> DataBall
  • TensorFlow 2.0 windows11 GPU 训练环境配置
  • Unity3D空中突袭(1)场景导入
  • 全面认识AI Agent,一文读懂AI智能体的架构指南
  • Qlik Sense QVD 文件
  • i春秋-Look(sql字符集、超短sql注入、写入shell)
  • [毕业设计]最全计算机专业毕业设计选题推荐汇总(源码+论文)
  • 稳联技术通讯Modbus转 EtherNet IP 网关 在机场行李运输系统中的应用
  • 【前端】将nuxt.js项目部署到域名二级目录下
  • FPGA上板项目(五)——UART测试,串口发送
  • 中间件--laravel进阶篇