当前位置: 首页 > article >正文

Python规整电商编码

说明

在电商店铺运营的过程中,会产生很多不同的编码组合,也会加上很多的前缀,这就不利于后期做数据分析。需要先对编码进行一个规整。

 案例:食品店铺

编码组合预览

python程序

import pandas as pd
df = pd.read_excel('D:/desk/编码.xlsx')
# 找到要进行操作的列和
column_to_read = '名称'
column_to_update = '数量'
hong = '红色'
cheng = '橙色'
huang ='黄色'
def update_hong(row):
    if '红' in row[column_to_read] :
        if '20' in row[column_to_read] :
            return 20
        else:
            return row[column_to_update]
    else:
        return ''

def update_cheng(row):
    keywords=['橙色','橘橙']
    if any(keyword in row[column_to_read] for keyword in keywords) :
        return row[column_to_update]
    else:
        return ''
df[hong] = df.apply(update_hong, axis=1)
df[cheng] = df.apply(update_cheng, axis=1)
def update_pw(row):
    if row[hong] != '':
        return "红色" + str(row[hong])
    elif row[cheng] != '':
        return "橙色" + str(row[cheng])
    else:
        return ''

pw='口味规格'
df[pw]=df.apply(update_pw,axis=1)
def update_pl(row):
    keywords1=['红色','橙色']
    
    if '蓝色' in row[pw] :
        return "蓝色"
    elif '绿色' in row[pw]:
        return "绿色"
    elif any(keyword in row[pw] for keyword in keywords1) :
        return "红橙黄"
    else:
        return ''
    
pl='品类'
df[pl]=df.apply(update_pl,axis=1)
# 按照某一列进行分组(假设为“列A”)
grouped = df.groupby('组合装编号')

# 对分组后的数据进行合并
# merged = grouped.aggregate(lambda x: ','.join(x.unique()))
merged = grouped.aggregate(lambda x: ','.join(x.dropna().apply(str).unique()) if x.name in ['红色','橙色'] else x.dropna().apply(str).unique()).reset_index()

# 保存文件
merged.to_excel(excel_writer=r"D:\desk\sku.xlsx", index=False)

后面还可以对其进行其他的分类以及分析


http://www.kler.cn/a/378894.html

相关文章:

  • STL--set(集合)
  • win11的WSL报错WslRegisterDistribution failed with error: 0x800701bc
  • 【网络协议】RFC3164-The BSD syslog Protocol
  • 抖音a_bogus,mstoken全参数爬虫逆向补环境2024-06-15最新版
  • 个人vue3-学习笔记
  • 【Linux系列】查看服务器是否使用了 SSD 的多种方法
  • docker 启动 neo4j
  • STM32 透传简易实现的软件方法
  • 基于SpringBoot的“CSGO赛事管理系统”的设计与实现(源码+数据库+文档+PPT)
  • ESP8266 自定义固件烧录-Tcpsocket固件
  • java脚手架系列12-mongoDB
  • 10天进阶webpack---(1)为什么要有webpack
  • 【数据分享】2024年我国省市县三级的休闲娱乐设施数量(免费获取/18类设施/Excel/Shp格式)
  • 中文词向量质量的评估
  • 服务器开启SSH允许远程连接服务
  • Springboot 内置缓存与整合Redis作为缓存
  • 7-12 检查密码
  • LeetCode 203. 移除链表元素(java)
  • Android面试整理
  • 【热门主题】000027 React:前端框架的强大力量
  • [C++]:智能指针
  • 大数据之——Window电脑本地配置hadoop系统(100%包避坑!!方便日常测试,不用再去虚拟机那么麻烦)
  • Python画笔案例-095 绘制鼠标画笔
  • [java][基础]HTTPTomcatServlet
  • 高防服务器都有哪些类型?
  • Java 正则基础