大数据技术的概念最早可以追溯到20世纪90年代,当时互联网的爆炸式增长导致了数据量的急剧增加。然而,直到21世纪初,随着计算机处理能力的提升和存储技术的改进,人们才开始真正关注大规模数据的收集、存储、处理和分析。
在2003年,一个名为“数据仓库之父”的人物提出了“数据仓库”的概念。他是一位来自美国的数据科学家,名叫W. Richard Stanley。Stanley博士是第一个提出将数据仓库作为企业决策支持系统(DSS)的先驱者。他认为,通过建立一个集中的数据仓库,企业可以更好地管理和分析大量数据,从而做出更明智的决策。
然而,Stanley博士并没有直接提出“大数据”这一概念。这个概念是在2008年被另一位著名的数据科学家,来自美国华盛顿大学的Doug Laney提出的。他在研究分布式计算时,发现了大量的数据需要被处理,而这些数据通常无法在单个计算机上进行处理。因此,他提出了“大数据”这一概念,并将其定义为“无法在合理时间内用传统数据库和数据处理工具进行捕捉、管理和处理的数据集”。
大数据技术的发展离不开云计算、分布式计算、物联网、移动互联网等技术的发展。这些技术的发展为大数据的处理提供了强大的技术支持。例如,云计算技术使得大数据的处理不再受限于单个计算机的性能;分布式计算技术使得大数据的处理更加高效;物联网和移动互联网的发展使得数据的采集变得更加方便和实时。
总的来说,大数据技术是由多位科学家共同推动和发展的。其中,W. Richard Stanley被誉为“数据仓库之父”,而Doug Laney被誉为“大数据之父”。他们的工作为大数据技术的发展奠定了基础。