т
调皮电商
电商零售·营销·产业互联网
关注
此文适合大数据爱好者阅读,电商专业人士也可用来开拓眼界,大数据已经进化到了又一个新的阶段。
01
先讲一个“远古时代”的电商故事。这个故事来自维克托·迈尔-舍恩伯格教授的名作《大数据时代》。
1997年,有个正在读博士的年轻人Greg Linden。他注册了一个网店,用来卖书。
这个网店就是今天无比牛叉的亚马逊。
亚马逊一开始的时候,聘请了一个由20多名书评家和编辑组成的团队,负责写书评、推荐新书。这个团队被称为是亚马逊皇冠上的宝石,是亚马逊的竞争优势,因为他们使得书籍销量猛增。
但是,亚马逊的创始人和总裁,贝索斯同学,决定尝试利用客户过往购物的数据来作推荐。这些数据包括他们购买过什么书,浏览过哪些书,浏览了多久,哪些浏览了却没买,哪些是同时购买的……
这个尝试一开始就像一个笑话。亚马逊的推荐信息是基于用户之间的相似性,结果导致推荐的书和客户上次购买的往往是大同小异,毫无价值。
亚马逊早期的书评家,James Marcus回忆说:
“那种感觉,就像你正和一群脑残在一起逛书店。”
但是,前面提到的那位人工智能博士,Greg Linden,很快找到了解决方案。他意识到,推荐系统实际上只需要找到产品之间的关联性,不用去比较用户。
1998年,Greg Linden和他的同事申请了著名的协同过滤技术的专利。这项技术使得推荐系统的发展突飞猛进。
到了什么样的地步呢?Greg Linden拿书评家团队和计算机推荐产生的销售业绩做对比,发现计算机推荐的业绩远超前者。
机器战胜了人类。那个曾经享有盛誉的“书评家”团队,被解散了!
(图片来自网络)
为什么我说这是一个“远古时代”的电商故事呢?因为那个时候,亚马逊只是动用了顾客的购物数据,利用了不同书籍的相关性,从而更加有效地推荐了书籍。
它只不过,成功地预测了人们买书的行为而已。
那么人类的其他行为呢?可以被预测吗?
我最近读了全球复杂网络研究的权威,美国的艾伯塔-拉斯洛·巴拉巴西教授的名作《爆发(Bursts)》。
这是一本野心勃勃,同时也非常有趣的书。巴拉巴西教授在书里主要探讨了一个问题:人的行为究竟是不是可以被预测?
他的答案是:绝大多数可以。
书中提到,他们做了数百万个用户的手机数据分析。基于通话时间、时长、位置等信息,最终研究人员可以精确地预测手机用户的行踪。
巴拉巴西教授说:
“我们发现所有用户的平均可预测程度都在93%左右。这就意味着人们只有7%的时间是行踪不定的。”
“对一些熵值低的用户来说,他们的可预测程度甚至接近100%。”
要知道,这项研究的时间是2008年。自那以后,随着智能手机的普及,人类行为可被记录的数据不知道增加了多少倍!
今天利用大数据,我们究竟已经可以预测多少东西?
02
以上两个故事,其实就讲了两点:
1. 大数据的分析,重在相关性而不是因果关系。因此在利用大数据的时候,计算机比人脑强太多了!
2. 人类其实并不像自己认为的那样复杂。基于你的过往行为数据,你的大部分行为是可以被预测的。
那问题来了:今天拥有中国最多消费者行为数据的,是谁?
我觉得是阿里巴巴。
有目共睹,这些年阿里巴巴在不断的兼并收购中建立起一个庞大的生态系统。阿里系的生活服务平台已经覆盖了中国消费者大部分的生活消费场景。
出门导航用高德,旅游用飞猪,看电影可以用淘票票,追剧用优酷,买东西用淘宝/天猫,支付用支付宝,更别提还有盒马、虾米音乐、口碑……
03
通过朋友的介绍,我认识了一个阿里巴巴的人,向他请教了几个问题:
我的第一个问题特别直接:
“阿里生态内的数据,你们真的全都打通了吗?”
Y先生给我了非常肯定的回答。淘宝、飞猪、闲鱼、虾米、优酷、高德、淘票票、支付宝……所有的数据都是打通的。
因此,阿里妈妈对消费者的理解,可以说是全方位的:消费者浏览过什么商品,喜欢看什么剧,经常出没什么地方,支付能力如何……简直是了如指掌。
不过Y先生强调,这些大数据绝对不会对应到个人信息,所以不用担心隐私问题。
“那你们用这些数据可以做到什么呢?”
“其实就是从历史数据推测未来,和你讲的《爆发》那本书里的意思差不多。”
Y先生拿中秋节的月饼举例说,算法可以帮助品牌主识别哪些用户会更喜欢什么类型的月饼。
“也许喜欢看历史剧的年轻男生会更喜欢五仁月饼。你永远都不知道这是为什么,但大数据只关心相关性而不是因果关系,只要知道这个相关性,我们就可以向这个群体推送五仁月饼的广告。”
实际上算法当然比这个例子复杂很多,会包含各个方面的行为数据综合考量。
Y先生特别强调,这和以前基于人群标签的媒体投放有显著差别。
“基于标签的投放,实际上是非常粗糙的。比如口红产品,会圈一些‘20-35’岁,‘月收入15000元以上’之类的标签来投。这一方面会有很多浪费,因为标签里的人不一定想买口红;另一方面,你也错失很多机会,因为标签外的人群可能也是你的消费者。现在基于算法的投放就精确很多。”
Y先生说,基于算法圈人也是刚刚开始做不久。618的时候某个美妆品牌做了试投放。通过算法圈处理的人群,比人群标签的人群,广告点击率达到7倍以上。
我问Y先生:“数据打通我get了。除此之外,阿里妈妈还有什么创新吗?”
Y先生回答说:“有啊!我们不但是从多维数据中获取洞察,我们还能帮助品牌触达在多维平台活动的用户。”
“我们现在经常讲三块屏:
个人屏,就是手机终端屏幕。覆盖电商和新零售,覆盖出行、旅游、新闻、娱乐等等阿里生态内的平台。
家庭屏,就是家庭智能电视;
公众屏,就是分众传媒旗下的楼宇智能屏,还有阿里这些年在社区、校园、娱乐、购物、办公很多线下新零售场景里布局的屏幕。”
“基于算法,对消费者进行触达。然后当这些消费者到淘宝天猫上去购物时,我们还能识别出来,对他们进行再次影响。转化率大大提高。”
“所以三块屏究竟可以覆盖多少人?”
Y先生轻声一笑:“不多不多,7亿多用户,7500万家庭,2万多个楼宇吧……”
隔着电话,真的很想翻个白眼。
(图片来自网络)
Y先生自己的嗨点,则是另外一件事:序列化投放。
他特别兴致勃勃地给我解释:
“你看,现在品牌投放最大的问题是什么?是信息传递的无序化!”
“以前投放的逻辑是什么?我们假设消费者是按照我们设计的顺序来接触品牌的:先通过电视广告认识品牌,然后通过其他媒体进一步了解品牌,最后在销售终端看到促销信息来购买。”
(大概就是这么个漏斗模型)
“真的吗?真的是这样的吗?消费者真的会按照我们的计划去接触信息吗?”
Y先生给出了直击灵魂的提问。
“现在消费者的时间这么碎片化,他们随时能接触到品牌信息:在抖音上,在淘宝上,在优酷上,甚至在高德地图上!”
“然后很有可能是不对的场景,不对的信息,遇到不对的人。”
Y先生长叹一声:“然后钱都浪费了。”
“但是我们可以帮助品牌方控制!”虽然隔着电话我看不到Y先生,但是从声音里我能感觉到他一脸得意。
“通过数据和技术,我们可以按照品牌方的要求,让用户按照预定的顺序看到不同的信息。”
“而且,不同的消费者,应该看到不同顺序的信息!”
我理解Y先生的意思。算法可以为每个消费者设计最能转化他的信息序列,并通过三块屏触达他。
Y先生给了我一个例子:
“比如一个对眼镜有潜在需求的消费者打开手机淘宝,看到了首页的一个眼镜广告。”
“我们通过系统算法,可以判断这个消费者和品牌的距离。如果算出来他还不认识这个品牌,那我们可能就在淘宝首页给他看这个眼镜品牌的T台秀,激发他的兴趣。”
“如果他在三块屏的触达下已经认识这个品牌了,那我们可能会在这里给他看眼镜评测来增强好感。”
“如果系统算法认为他已经就差临门一脚了,那我们就推送VR试眼镜的互动,让他更快决策。”
Y先生说,某高端美妆品牌在618期间就进行了序列化投放的尝试:“效果惊人的好。证明我们的方法论是正确的。”
Y先生就序列化投放这个话题跟我聊了很久。他实际上想传达一个信息:
过去依靠经验和直觉来进行消费者沟通的方式,是非常落后的。
在拥有海量消费者行为数据的基础上,计算机能够根据消费者的特点,展示千变万化的信息,并以最佳顺序组合,从而实现最高效的转化。
真正的品效合一。
04
回到巴拉巴西教授的《爆发》这本书。
书里还有一个故事,是关于物理学教授刘易斯·弗赖伊·理查森的梦想。
理查森教授在1913年加入了英国气象服务站。他发现他的同事们预测天气的方法非常落后和任性。
因为他们预测的方式,是监测当天的气候,然后去找历史数据里面和这天相似的天气记录,然后假设明天的气候,和历史记录里那天之后的一天保持一致。
理查森教授认为,利用他的物理和数学知识,完全可以作出更好地预测。
于是他先开始尝试预测6小时后的天气情况。但这需要巨大的计算量。大概就是需要6个星期的准备时间,而且每天不眠不休工作24小时……
最后理查森教授估计,要跟上变化无常的天气,他需要雇佣64000人。事后证明,其实他算错了。
他至少需要20万人……
理查森没能实现自己预测天气的梦想。但是今天,我们全球的天气预报系统对未来三天的天气预测准确度已经达到了95%。
而且,这个系统正是运用了理查森教授的方法!
那为什么他没有成功呢?原因很简单:
第一,今天气象系统依靠精密的雷达和卫星地图,可以收集到比理查森时代全面精确得多的海量数据。
第二,高速计算机取代了他想要的20万人,而且不会出错。
我为什么要提这个故事?
你不觉得,同样的故事也正在营销领域发生么?
海量的数据,高速的计算机……虽然不情愿,我们也不得不接受这个事实:在很多方面,计算机系统做得比我们的大脑好太多了。
放弃妄自尊大,接受新理念,驾驭新技术,才能帮助我们营销人进化。 (YogurtBrotherSean)
完
点击