大数据一词最早出现在20世纪90年代。1993年,Gartner Group提出了“信息过载”的概念,认为数据量呈爆炸式增长,企业和组织需要处理和分析大量数据以获得洞察力。1997年,Gartner Group进一步将“信息过载”定义为“企业无法在合理时间内用常规软件工具来捕获、存储、管理和处理大量数据”。
1998年,Horton Smith在他的著作《Big Data》中首次使用了“大数据”这个词,并将其定义为“巨大的数据集合”,这些数据集合通常难以通过传统的数据处理工具进行处理。他提出了一种基于分布式计算和存储的新方法,用于处理大规模数据集。
1998年,IBM在其研究报告《The IBM Big Data Journal》中首次使用“大数据”一词,并描述了其含义。该报告指出,大数据是指传统数据处理工具无法有效处理的大规模数据集,这些数据集具有海量性、多样性、高速性和价值密度低等特点。
随着互联网的发展和数据量的激增,大数据逐渐成为一个热门话题。2011年,麦肯锡公司在其报告中首次使用了“大数据”一词,并将其定义为“大量的结构化和非结构化数据,这些数据来自多个来源,包括社交媒体、传感器、日志文件等”。
总之,大数据一词最早出现于20世纪90年代,由Gartner Group、Horton Smith和IBM等专家提出。随着互联网的发展和数据量的激增,大数据逐渐成为一个热门话题,并在2011年被麦肯锡公司正式定义。