当前位置: 首页 > article >正文

对商品分类系统的若干问题的思考

   科学研究的目的就是研究事物的特征,并根据共同的特征加以分类

        商品分类是商业,制造业中最普遍的活动,几乎所有的企业,电商平台都要对销售的商品,使用的原材料(BOM)进行分类和编号。

       商品分类貌似没有多少技术含量,它是数字化转型的重要基石。一个不合理的分类方法会导致混乱和难以使用。

现有商品分类系统遇到的问题

各种标准化组织和机构提出了分类系统,它们包括:

  •  UNSPSC
  •   GS1
  • ETIM
  • ECL@SS
  • IEC 61360

      它们有的是公开免费的,有的是收费服务的。分类方式也各不相同。使用这些分类标准面临各种挑战。

      我们以gs1为例,讨论现有商品分类中遇到的问题。

       GS1全球商品分类标准(Global Product Classification, GPC)不断扩展更新,每年发布两个新版本。GPC分类代码按照大类(Segment)、中类(Family)、小类(Class)、细类(Brick)来划分,并细分为具体的商品核心属性类型和属性值。商品数据交换中,通常采用第4级代码,即细类代码。

    但是这种4级分类仍然不够细。进一步细分只能依靠属性(attributes)来分类了。例如服装的分类如下

Segment 67000000服装

Segment67000000 服装
    Family67040000内衣
    Family67010000服装
        Class67010800上半身服装或上衣
            Brick10001361上半身服装、上衣组合装
            Brick10001350夹克、外套、羊毛衫、马甲
            Brick10001351毛衣、套头毛衣
            Brick10001352长袖衬衫、女式衬衫、马球衫、T恤

显然这样的分类不够的,需要进一步细分 ,比如男女,风格,材料等。

属性,特征和特性区别

      在讨论信息模型时,经常提到属性(attribute),特征(Property)和特性(Feature),有的地方使用attribute ,有的地方使用特征(Property)或者特性(Feature) ,那么它们到底有什么区别呢?

      我们知道,模型是事物的简单描述。模型描述了事物的特征(Property)以及与其它事物的关系(Relationship)。

        从分类的视角看,事物是通过某些主要特征来分类的,主要特征相同的商品被分为一类。这主要特征称为属性(attribute),我们能够体会属性与特征的不同,用于分类的特征是属性。

       在某些分类系统中,属性是类别中默认的。而商品的描述中包含了某些特征(Property),而在一些分类系统中不仅规定了类别,又定义了属性

     例如服装的性别,gs1 提供了属性和属性值

        而Feature (特性)是增加功能或吸引力的独特方面或品质。这些方面通常作为卖点进行推广或突出显示。它们是旨在带来特定优势或功能的元素,使产品从竞争对手中脱颖而出。特性可以理解为独特的特征。

     例如:毛衣的属性及性别的属性值

Brick10001351毛衣、套头毛衣
    Attribute20000045消费者年龄段
    Attribute20001131性别
        Attribute Value30004039男性(雄性)
        Attribute Value30003891女性(雌性)
        Attribute Value30002518尚未确定的
        Attribute Value30002515未分类的
        Attribute Value30004340中性的
    Attribute20003164是否带帽
    Attribute20001141是否保暖
    Attribute20001941服装袖长
    Attribute20000794材料类型
    Attribute20001942毛衣、套头毛衣类型

     笔者主张在产品分类系统中只有类别,不包含属性。而在商品描述中包含特征(Property)。这样更加清晰一点。而Feature 更多地包含的宣传文档中。

 分类系统的挑战

常见的分类系统有下列几种:

GS1ETIMECL@SSUNSPSC
SEGMENTGroupSegmentsSegment
FAMILYClassMain GroupsFamily
CLASSGroupsClass
BRICKCommodity classesCommodity
Business Function

     但是它们之间的分类方式是不同的。

        比如:医疗设备。 在GS1 中是一个Brick,而在ECL@SS 中是一个Segment,这就意味着在ECL@ 中,医疗设备分的更细 。

 相比ECL@SS 而言,gs1 的分类过于宽泛。

分类系统的颗粒度

        到底分类到多细才合适呢?这也许没有明确的答案,侧重点不同,分类的颗粒度也不同,在笔者看来,分类系统的颗粒度与产品属性的颗粒度有关。最底层的项目,应该具有相同的属性。

        某种意义上讲,属性也是一种分类。可以将分类变成属性例如:性别。你可以将服装分类为男性服装,女性服装,儿童服装,成人服装和老年服装。当然你也可以在服装中,定义:适应性别,适应年龄段属性。

我们的研究更倾向在gs1 的基础上进一步细分,将gs1与ecl@ss 结合起来。构建6 级分类系统

  • Segnment
  • Family
  • Brick
  • Main Group
  • Group
  • Commodity

这样的安排的好处

  •   商品分类的颗粒度更细,符合商业分类的习惯
  •   有利于引用ECL@SS 的属性
  •   有利于gs1和ECL@SS 的映射和转换
  •   采用12位分类编码,能够细分更多的商品,前三层对应gs1编码,后三层对应ECL@SS 的MainGroup,Group和Commodity

  

商品的特征

商品的模型是由商品的特征(Property)组成的。分类系统与商品特征结合在一起,形成了如下分层结构。

  • Segnment
  • Family
  • Brick
  • Main Group
  • Group
  • Commodity
    • Property
      • Property
        • Property

     这种方式在gs1 的BRICK 基础上进一步细分,商品特征描述提供了商品信息模型。

分类系统与产品信息管理系统的关系

       分类系统的主要用途是商品的信息管理(PIM),确切地讲,分类系统是产品的模型,而商品是产品模型的实例及其组合。需要将分类系统和PIM 系统区分开来,分类数据库中每一项对应一个商品类型,而产品数据库中的每一项是一个产品的SKU(库存量单位)。SKU 包含了无包装单元,单品,包装和托盘。无包装单元对应GS1 中的一个类。而单品,包装箱和托盘包含了SKU 的其它一些信息。比如SKU 的名称,图片,重量,价格等等。

        商品的基本属性与SKU 的属性是不同的,如果将所有的SKU 信息包含到分类系统中,会引起混乱。将它们分开视乎更合理。

   分类系统的项目是无包装单元的属性

BMEcat

  BMEcat 是一个目录交换标准,创建于 1999 年,由德国 BME - Bundesverband Materialwirtschaft, Einkauf und Logistik e. V.. 协会开发。该标准基于 XML,完全开放且不收取任何费用,其最新版本是 BMEcat 2005。 

        供应链中的所有合作伙伴(制造商、批发商、供应商)都在交换越来越多的数据,而不同的数据格式使流程复杂化。通过使用 BMEcat 标准化信息系统之间的通信,大大降低了所有参与公司的成本。

PIM的数据模型

  •  产品模型
  • 机构模型
  • 测量单位

产品模型 

{
    "ID":"产品ID"
   "Name":"商品名称",
   "Type":["无包装单元","单品","包装箱","托盘"],
    "Items":[{
        "Code":"单元的编码",
        "Type":"单元类型",
        "Number":1
    }] 
  "Supply":{
    "Name":"供应商名称",
    "Id":"供应商ID",
   }
   "Brand":"品牌",
   "Measurement":{
      "Length":"长度",
      "Width”:"宽度",
      "Height":"高度"
   },
   "Images":[{
     }]
   "Documents":[{
  }] 
"Price":"价格"
 }

结论

  分类系统是数字化转型的重要基石。同时它也是十分费时的辛苦工作。也许chatGPT AI 工具能够提升构建分类系统的效率。本文提出了目前几种分类系统存在的问题,并且提出了自己的看法。下一步我们将问题进一步的细化。从中发现更多的问题和解决方法。

   


http://www.kler.cn/news/312559.html

相关文章:

  • 【Linux】程序地址空间
  • 数据库函数
  • C++_CH18_构造函数与析构函数
  • Java优先级队列PriorityQueue
  • 大数据Flink(一百二十二):阿里云Flink MySQL连接器介绍
  • 将阮一峰老师的《ES6入门教程》的源码拷贝本地运行和发布
  • 【深度学习】注意力机制介绍,了解什么是注意力计算规则以及常见的计算规则,知道注意力机制的工作流程
  • Linux 基础入门操作-实验一 GCC使用
  • 优化 Elasticsearch 集群性能:解决节点压力不均衡问题及分片策略调整
  • git统计代码行数、提交数
  • 每日OJ题_牛客_WY22 Fibonacci数列(斐波那契)
  • 解决uniapp视频video组件进入全屏再退出全屏后,cover-view失效的问题
  • C++——用选择法对10个数值进行排序。
  • 即时通讯框架MobileIMSDK的H5端开发快速入门
  • Python数据分析案例60——扩展变量后的神经网络风速预测(tsfresh)
  • 系统架构设计师:系统架构设计
  • etcd二次封装
  • Docker上安装mysql
  • MySQL在大数据场景应用
  • 代码随想录训练营 Day60打卡 图论part10 SPFA算法 Bellman-Ford 之判断负权回路 Bellman-Ford 之单源有限最短路
  • vue常用业务场景
  • 通过springcloud gateway优雅的进行springcloud oauth2认证和权限控制
  • Python编码系列—Python代理模式:为对象赋予超能力的魔法
  • QTcpSocket和QLocalSocket详解
  • 【网络编程】socket套接字|sockaddr|sockaddr_in|通信过程
  • 《深度学习》—— 神经网络模型中的损失函数及正则化惩罚和梯度下降
  • 如何搭建虚拟机Ubuntu?
  • icpc江西:L. campus(dij最短路)
  • el-input 只能输入数字和一个小数点,或者只能输入两位小数
  • OpenHarmony(鸿蒙南向开发)——小型系统内核(LiteOS-A)【时间管理】