【转】数据是未来的原材料

Posted on Posted in 电子商务

十分喜欢车老师的文章,每篇都是经典!

转发微博已经无法满足,必须转载,原文地址:http://blog.sina.com.cn/s/blog_5025e38801013p8i.html

电商交易量每年增加一倍,但对所积累数据的了解程度是否跟着增加一倍呢?如果电商现在不开始收集数据及应用起用,未来要用数据的时候,就会发现过去的数据已经是一堆垃圾。 许多人已经开始意识到,未来的电商是数据之战,在这种大数据的背景之下,电商收集数据的边界在哪里?又该如何快速运用数据做出正确的商业决策?这是多数电商公司的困扰。
  

数据是越多越好吗

 

数据是未来的原材料

后来在美国遇到Patil,他认为过去收集数据很难,而现在获取数据资源变得更容易。但是如果收集数据的出发点,不是为了解决问题,那么收集再多的数据有什么意思呢?

 

可是许多公司还有一个疑问是,现在收集数据不难,成本也不高,为什么不先收集数据再说呢?等以后需要数据来解决问题时再拿出来用也可以。Patil的答案我也很认同,他劝大家千万别这么想,用这样的理念来设计数据应用肯定会失败的。数据是没有边际的,我为此也痛苦了好一段日子。比如收集一个人的生日,可以精确到几分几秒,但这么精确的数据有什么应用,能产生什么价值呢?

数据是未来的原材料

事实上,数据是有生命周期的,比如从中国身份证号码是可以推断出性别的,但是过几年如果这个规则变了,导致我们基于数据所做假设和决策依据也就失去了意义(Data Broken)。更何况保存数据及其收集时的背景(Context)也是一件不容易的事情。所以说,在收集数据的同时,我们必须知道未来可以用来做什么,今天都想不出来的话,日后就更不容易想出来了。

 

打一个比方,今天很多电商老板会问重复购买率是多少,于是我们收集数据来计算重复购买率,却很少想到需要重复购买率来做什么决定。这就好比刻舟求剑这个故事,他告诉我们世事在变,我们不能只是机械的套用方法或指标。就像重复购买率有不同的定义,而做不同的决策需要不同定义的重复购买率。如果从一家投资公司的角度来看重复购买率,它想收购A公司,那么会从重复购买率来看整个A公司的健康程度或用户质量等。如果从A公司本身运营的角度来看重复购买率,那么它更关注的是日、周级别的重复购买率的变化趋势,或者当月新增客户有多少人在三个月后的重复购买,从而可以衡量每个月新增及存量客户的忠诚度和质量,找出改善的空间。知道了以上的背景之后才去选择用什么数据不是更靠谱吗?

 

数据应用因小而美

 从2011年年底,我开始思考怎么从“用数据”转变为“养数据”(即数据运营转变为运营数据),这一段时间我特别为收集什么样的数据而烦恼(more data, more problem)。而且,我也曾经想做一个特别大的适合多数人使用的数据应用出来(虚火上升),可是后来发现这在数据应用的起步阶段几乎是不可能的,一是找到可以解决大部分人需求的数据应用不容易,二是支付宝的数据非常丰富,需要考虑的因素很多,因素之间的联系又很复杂。

 

数据是未来的原材料

 

所以,我总结,当做数据应用的时候,数据就是等于原材料,当原材料一直处于变化的情况下,做出来的产品很容易出问题。体会数据和应用的关系之后,我最后决定从小角度切入,先做小应用出来(很好的瞄准器)。

 

这里说的“小”指的是应用的目标很具体。打个比方来说,对于一款数据应用,如果我的目的是分辨两种决策谁更好,差异在哪里,是很具体的问题。但如果我的目标是想知道如何让公司赢利,就是一个空泛的目标。

 

还请注意,“小”不是指数据量。许多人在没有获取足够数据,并且缺乏对数据理解的情况下做判断,其实是在享受自己的无知。

 

经过一番周折之后,也是按照小角度切入的想法设计数据应用,小角度切入设计产品可以做到具体和快速,而且可以避免因原材料的变化而导致的问题。

 

把数据放进“框”之中

  

此外,还不得不说到一个话题,在大数据的背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个“数据框架”(情景)里面看才能看出问题。

数据是未来的原材料

为了把问题说得很明白,这里我拿前阵子一家电商公司找我讨论的问题举例子。这里不太方便公开这家公司的名称,暂以A公司代替。

A问我,要不要撤去导航网站的广告?因为怀疑许多老客户是从导航网站访问官网,而不是直接访问官网。

把这个问题说得再直白点,就是要弄清楚在导航做广告与A公司的业务关系。

那么,接下来要观察用什么“数据框架”,有助于做决策?

一、A公司当前的投入产出比

1、明确导航网站引进来的新、老用户占比如何?

2、引入的新、老用户的投入产出比和转化率如何?

3、推断撤去导航网站,对流失新老用户的影响?

 

二、与竞争对手的博弈

有一个问题可能会忽略,那就是你不做导航网站广告,你的对手就会立马进来。做数据框架的时候,要特别注意框架不是静态的,而是博弈的,需要把竞争对手因素算进来。

 

三、考虑时间因素

建立框时要考虑时间因素:

1、  用现在、过去和未来的眼光来审视导航网站,看看导航的质量是不是越来越好

2、  需要注意的是时间有延迟性,引进来的流量会有一些延迟,在两三个月后才能知道新用户的价值(life time value)。

 

总之,“数据框架”是商业分析师的灵魂所在,从框中找寻问题的关键因素及答案。不同的问题有不同的框,不能完全在此全部阐述。

数据是未来的原材料

如何用框架来做决定?

对此,我总结了四步走的方法:

 

第一,首先确定有什么问题,从解决问题的角度出发收集数据;

第二,把收集的数据整理好,放入一个“数据框架”内(这个框架是用来帮助决策者做决定的)。让决策者用框更清楚地看到数据与决策之间的关系,比如A公司在框架内要知道竞争情况、新老客户比例情况等因素,以及多种因素互相的关系。

第三,看框架与决策的关系,比如A公司与导航网站有三种选择,完全不合作,部分合作,全面合作。根据数据框架告诉A公司该怎么决策。如果发现数据框架与决策不能匹配,就必须返回到第二步。

第四,根据决策做出行动,检查行动是否达到了目的。如果行动了发现根本没达到目的,就要检讨整个链条,看问题出在哪里。是数据有问题吗?还是因为框架不对?或者是决策不对?是否还有数据没考虑进去?

 

所以,又回到之前我老说的话题,不懂商业就别谈数据。想要解决的问题越复杂,框架也越复杂。而对于现在多数还没有开始做数据应用的电商公司来说,一开始框架千万不要太复杂,一定是针对某个需解决的问题开始搭框架,令框架与决策之间的关系非常清楚。你的问题是什么,你的decison是什么,反过来你的框架又该怎么样。从小角度切入,从“小”做起。

(文字整理:大红, 慕乔, 王彦)

 

One thought on “【转】数据是未来的原材料

  1. 这个文章我在Gameres上看到了,写的很不错,结果被一个所谓牛人喷了一地,看了他的评论,我觉得那个人实在不懂数据。哈哈,最近你的东西蛮好的,高度有些高了,下面那些新人有点看的云里雾里的

发表评论

电子邮件地址不会被公开。 必填项已用*标注