即使企业有开发大数据的能力(其实大部分并没有这个能力),他们还总是喜欢使用未经测试的想当然的想法,而非利用数据科学来做决策。视觉分析公司Atheon Analytics的总经理Guy Cuthbert认为,即使是在那些使用数据的公司中,许多仍然会有选择性的支持那些已经被认可的观点,而非真正数据验证的事实,而利用数据本身,只是靠想法制定决策的一种伪装罢了。
最近Actian公司在伦敦参加的一个圆桌会议上,Cuthbert谈到,数据科学涉及到提出假设和检验假设的方法,但他所遇到的大多数商品零售企业都绕过了这两个方法。
他说:“我能一口气说出许多零售商的可怕故事,这些故事都有一个共同点,即这些零售商相信客户存在一个特定的行为方式,因为他们在开张的那一天就有人这么告诉他们了。他们从了没有真正质疑过这些说法而去探究真实的情况——品类的真实情况、国家中特定地区的情况,或尺码的情况。数不清的案例表明,人们轻信别人告诉他们的东西,但却不去自己探究真正的事实是什么样的。
“我们做了很多工作,想要把各种组织从‘想法驱动’改变为‘数据驱动’,让它们开始采用事实和假设的科学方法,而不是‘想当然’。”Cuthbert说。
Cuthbert说,自己曾经努力帮助过许多公司,以让它们理解它们的产品的绩效表现,但这些公司都无法被认为具有“分析能力”。按照他的推测,全球的商业企业中大概只有百分之一甚至是只有千分之一是真正的数据驱动的。
Cuthbert说:“我见过大量的依靠直觉运营的企业并不了解原来数据还可以产生决策。我也听过太多高管们滔滔不绝地喷出了各种各样的其实没有什么‘营养’的想法。因此,如果数据绘制者或者数据科学家去做一些事情,去教商人们他们的组织中所蕴含的那些令人着迷数据及背后的事实,他们就会开始自觉地去认识它们了。”
然而,让业务揭穿企业中的一些(不真实)的神话并开始接受现实,接受以数据为基础的结论,并非易事。
“在我们向人们展示我们的观点时,常遇到一些充满火药味的‘回击’,他们当面指责我们,说我们所说的是彻头彻尾的缪论。”Cuthbert说。
另外一个问题是即使公司试图科学地使用数据,他们关注的点也过于聚焦而狭隘。
“大多数与我们合作的公司关注已知的东西,他们总是着眼于诸如‘我们希望明年的收入增加6%,让我们确保能搞定6%’之类的东西。”Cuthbert说。
“他们没有去寻找增长30%或者120%的机会。我们很多工作只是浮于表面,或者展示那些他们其实自己也没有弄懂的一套东西。”
不幸的是,尽管技术进步让我们能够非常容易地处理数十亿条数据,但分析本身,却必须依靠与人力完成。
“机器缺乏灵感,这是造成机器学习以及其他计算机技术与人类思维鸿沟巨大的现时原因。”Cuthbert说,“灵感来自于人类懂得如何从数据中找出隐含的信息。”
大数据分析公司Actian(之前叫Ingres)的CEO Steve Shine说,一直到现在,为了满足大数据所需要的开发技能,他们拥有一组特定的高预算的客户,这些客户需要他们的这些技能完成项目。
“在过去的三四年中,如果你在任何的一个地方接触过hadoop项目,你就会意识到,能够写一个高效的MapReduce程序并使hadoop高效运行是一个相当牛逼的技能。”Shine说,“这种技能被技术社区热切地保护了起来,却并没有扩散,但最近的12个月内发生了戏剧性的变化。大家都接受了一个事情,即需要让利用新的技术变得更加容易。”
“我们把人们带回上世纪80年代,那时如果你能有现在通过代码来获取所有的数据和发现新见解的能力,你将会变得有多么的多产。”
但现在新的问题是,大数据技术在迅猛扩散,各种版本的Hadoop、NoSQL,以及提供和整合数据的新方法层出不穷。
|