常完全非结构化并存储在

什么是大数据

大数据一词指的是大量信息,通某种数字介质上。数据阵列的大小非常大,无法使用传统方法进行处理。这一概念也被解释为一种用于搜索、分析、准备和解释大量信息结果的复杂技术。

“大数据”一词的作者被认为是克利 WS 数据库  福德·林奇,他于 2008 年在《自然》杂志的特刊中首次使用了该词。他评论了信息流的快速增长。大数据技术可以处理24小时内容量超过150GB的数据阵列。

 

资料来源:shutterstock.com

许多统计公司的分析师计算出,2005年,地球上 面向初学者的机器学习教程 虚拟空间中可供专家使用的信息约为4-5EB(40-50亿千兆字节)。短短五年间,大数据处理技术已发展到可以组织高达0.19泽字节(1 ZB = 1024 EB)的规模。

2012年,这一数字已经达到1.8 Zb,2015年则 联合王国数据 达到7 Zb。专家合理预测,到 2024 年,大数据系统将运行 147 ZB 的信息。

直到2011年,大数据数字技术还被认为是一种积极研究和分类的理论,几乎没有实际价值。但信息量的快速增长给科学家带来了高质量处理的问题。这一趋势在 Google Trends 统计数据中清晰可见。

这一问题已经引起了微软、IBM、Oracle、EMC等数字行业巨头的密切关注,各个大学和研究实验室的IT专家也开始尝试探究大数据技术到底是什么。自 2014 年以来,我们开始尝试以切实可行的方式实施这些发展。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部