大数据是如何产生智能的
严格来说我们常说的大数据并不只是数据本身,还包括对这些数据的处理和应用。
从数据物理意义来讲,海量样本数据与小样本数据的本质是相同的,然而,海量样本数据之间就隐藏有数据的变化关系、趋势,可利用所挖掘出的这些数据关系、趋势,从而解释或发现这些数据宿主的行为、业务、状态等,因此,挖掘海量数据背后的这些关系、趋势等就是大数据所隐藏的“黄金”。
那么,海量数据的价值如何挖掘呢?或者说挖掘出来的价值为什么说有智能呢?
其实,答案就是人工智能。人工智能的核心之一就是各类算法,如深度学习、强化学习、人脸识别、语义识别等背后的关键就是相应的算法。但是,仅有算法,没有相应的数据,甚至是大量的数据,以及对应的运算能力,那么算法也不能达到预期。
这就是为何神经网络算法、深度学习算法虽然已经出现了几十年,但是在云计算、大数据出现之后,才得到爆发的原因。所以有人说,云计算、大数据为人工智能装上了两只翅膀,使得人工智能一飞冲天。
通俗地讲,智能是还不流行的技术或者方法,智能一旦流行,就不应该是智能,最多就是技能或知识。如中国象棋的“马后炮”,发明之初拥有这个手段、技巧的肯定被称为智能,但在棋界中最多被称为一种着法、一种定式。
因此,通过人工智能的方法、技术能发掘出大数据中数据之间的关系、趋势,是以前小样本数据中无法发现或揭示出来的,其中就具有“不流行性”特征,所以人们才会说“挖掘出来的价值具有智能”或者说是大数据智能。
由上述可见,随着人们对大数据价值的逐渐认识,必定会注重数据采集、数据积累,而伴随着数据的不断积累,人工智能算法也会被不断优化,这就会进一步提高算法的准确性和价值性,从而再次提升大数据智能。
例如,驾驶中使用百度地图的点到点路径规划,起初由于用户少、产生的数据也少,其路径规划准确性就差;但随着用户增多、客户数据增多,其路径规划的准确性逐渐得到提升,乃至达到令人惊奇的“准确”。此时,人们普遍就认为百度地图有智能,其实内部隐藏的基本原理就是如此。