杜寒:揭秘条码背后的大数据与商机

过后台进行处理可以反馈给法务部门,等于把打击对于商品条码非法使用掀起了人民战争的汪洋大海,所以商品条码有这么多的特点,完全有可能也应该被移动电商行业所应用去进行相关开发。

前面我介绍的是我们在07年到去年这两年所干的事情,就是启发我们的行业,包括启发我们的消费者有意识拿手机去扫这个条码,等于一个前端普及教育的过程,从去年开始,我们意识到我们该进入下一个过程了,那是什么呢?就是关于条码扫描以后通过手机获得的信息是不是可信?这是美国的一个科研机构做的调查,全球范围内来讲做了一个统计,消费者扫描商品条码,有91%的数据是失真的,或者干脆就是缺失的、不正确的。倒过来想我们只有9%的数据对我们来讲是真正有意义的,有使用价值的,前面也有嘉宾说到我们要做大的数据,大数据的建立绝对要建立在真实的数据基础至上,如果说做数据分析这些数据来源就不可靠,不准确的话,实际上对我们基于大数据分析作出的决策是非常有危害的。

我再现身说法一下,因为我们单位有一些年轻员工经常爱网购,上周发生了一个什么事呢?我一个同事非常爱买一些化妆品,那天她收到一个化妆品发现这是一个眉笔,发现怎么在网上看的东西不一样呢,买的时候是进口产品,但是通过条码描述全部是中文,她马上到数据库查,看这个产品履历是什么样的?

如果这种意识可以贯彻到我们移动应用每一个消费者那里,这个价值就是真实存在的。

这些原因是什么呢?我有一个客户就是在PC时代积累了很多的数据,他们现在想做客户端,但是发现一个问题是什么呢?他们以前做系统和数据库的时候没有设计商品条码这一类,我们消费者扫描的时候没有从他们数据库查询出任何信息,怎么办呢?我们就想启示大家,在做平台和系统设计的时候,有关商品的时候,一定要想办法把有关商品数据项加上去,今天不用以后也一定会用到的。

第二还是这家企业,他说我有其他数据可以进行一个匹配吗?我能不能把这个商品条码补充进去做一个匹配?说实话匹配度并不是很高,并不是说他们数据不全,也不是我们数据不多,而是标准化数据标准化程度不够。同样一款产品什么叫红?红的这个色的指数是多少?绿的指数是多少?毫升这个容量是写中文耗量还是ML,ML还有大小写之区别,所以如果没有匹配也不能说这两个东西是一个东西。

还有一个是数据不权威,对外说我数据有上亿条,但是这里面有很多杂质在里面,比如有没有重复的,有没有老旧的,所以数据来源是不权威的,希望得到大
分享到: 微信 更多