形形色色设备产生的数据量时刻不停地飞速增长,如何利用每天产生的天文数字量级数据,成为科技业面临的一道难题。
根据思科的数据,全球互联网吞吐量在2016年为1.2ZB(1ZB相当于10亿TB或1万亿GB),预计到2021年将增长到3.3ZB每年。汹涌上涨的数据洪流,波峰越来越高,在2016年,每天数据流量同比增长了32%,而流量最高的1小时数据吞吐量同比增长了51%。
数据源于思科
当上述统计也不完整,实际上没有人知道全球每天产生多少数据,因为并不是所有设备的数据都会连入互联网。
数据量本身意义不大,如何量化数据的价值才是关键所在,但在如何应用数据,以实现其价值方面,当前还没有行之有效的方法。
想挖掘数据的真正价值,就要对天量数字与模拟数据进行过滤,并充分考虑应用场景,这就像沙里淘金,大多数可能无功而返。不过,随着计算力的提高以及大规模并行计算工具的成熟,数据过滤分析--即找到更好的应用数据方法--已经能够创造出颇具市场前景的商业模式。
“众多行业人士指出,不同数据应用方法与其器件和商业模式相互关联,并对其商业、市场以及商业模式产生影响,”Synopsys董事长兼共同CEO Aart de Geus说道,“如果你能够从中找到捷径,提升效率,或者全新的商业模式,那就会是非常大的影响。 ”这也意味着高利润的可能,“你会看到,所有从事数据处理的人都在仔细聆听,以解码市场未来需求,或者自行判断当前市场需求,”de Geus继续说道,“或者更进一步,他们准备置身于数据通路之中,从而最靠近数据商业化的中心。”
这正是资本疯狂涌入的原因,从数据挖掘到云端服务,从机器学习到工业物联网,每一个数据应用场景都战况激烈。
“谁拥有数据,具备数据分析及处理能力,谁就能把所有钱都赚走,”西门子Mentor事业部总裁兼CEO Wally Rhines这样表示。
现在还难说数据应用是一个胜者通吃的游戏,不过确实有不少科技巨头在这个领域跑马圈地,奋勇争先,例如亚马逊、谷歌、微软、Facebook和IBM等掰着手指头就可以输出来的大家伙。
“收集上来的物联网数据中,包含了设备大量的性能、行为及应用数据,”IBM美洲区销售主管Christophe Begue说道,“我们接下来会把收集到的数据丢给Watson(IBM人工智能平台)去分析。”
现在的大问题是如何将这些数据变现,有哪些人愿意为数据付费。要将数据变现,首先要做到如下几点:第一,行业里的公司要真正懂数据的价值;其次,公司要能够快速应对数据变化,只要比别人快百分之一秒,券商就能够以此牟利,但现在大公司应对数据变化的反应时间通常是几天甚至几周;第三,变现数据的价格要有竞争力,不能波动太大。
IBM正准备将全球供应链的数据商业化。“供应链数据分为两层,”Begue说道,“第一层是零售与快速消费品(CPG)等数据,就是那些可能会影响到食品与饮料等销售的数据。你可以在附近的一个商店收集天气、交通或运动赛事等相关信息,并通过交通模式追踪它。我们用Metro Pulse平台来做数据分析,该平台会覆盖500个数据元素,用户既可以购买数据用于深度学习或机器学习分析,也可以全部委托IBM来做分析。第二层即我们正在导入市场的概念:供应商风险。IBM将天气与政局变化等诸多因素纳入考虑,从数据中分析供应链的安全程度,并根据分析结果来提升供应链的安全。如果注意到15个因素有风险,那么你就会对这15个因素严密监控。”
IBM的服务并不是值分析已有数据,还会给出建议,洞见未来。“我们收集公开与半公开数据,有些数据只在IBM内部使用,我们建立预测模型。当然,我们也意识到,在计划和反应之间,仍然存在差距,‘决策室’概念有助于缩小计划和行动之间的鸿沟。”
智能制造
并不只外部收集的数据才有用,工业生产中,内部产生的数据就很有价值。事实上,整个智能制造的概念(德国称为工业4.0,也有人称之为工业互联网)就是如何把内部数据利用好。
“一言以蔽之,工业物联网是为了提升生产效率,”Optimal+市场副总裁David Park说,“现在这些公司都偏爱流程分析和无库存生产,但它们真正需要的是预测性分析。预测性分析可以让工厂受益,不过受益最多的是品牌商,品牌商和工厂可不一定是一回事。”
风险在于,数据不一定都是正确的。基于错误数据而做出的决定,将导致结果难以预期。
“如果数据没问题,那么可以把良率提高2%到3%,非常显著的提高,”Park说道,“供应链上通过检测的任何元器件的所有时间段数据都会被收集。当你拿到一些有划痕的晶圆,根据数据就能查出在哪一个环节晶圆被划破,你也可以查看元器件在现场的老化过程。如果汽车配备了预测性维护服务,那么你就能看到汽车在路上的相关数据。金融业同样会受益,如果你手上有数十万张发票,靠人工是捋不清发票之间的相互关系的。”
这种数据分析对于复杂供应链特别重要,半导体制造本身在数据分析与应用上先进,但整个半导体供应链对数据的应用,并不都能达到制造环节的水平。
“有效利用数据是智能制造顾问委员会(隶属于SEMI)的一大主题,”SEMI协作技术平台副总裁Tom Salmon说道,“获取数据很重要,但现在问题不是我们获取的数据量不够,而是因为数据利用率只有10%左右。真正的挑战在于我们应该问什么样的问题,如何把数据应用于制造。所以可能会有可靠性问题,但不会有制程问题。”