当前位置:主页 > 综合资讯 >

2019年全球大数据产业市场现状及发展趋势分析

发布时间:19-11-05 阅读:536

大年夜数据(big data),是指必要经由过程快速获取、处置惩罚、阐发以从中提取代价的海量、多样化的买卖营业数据、交互数据与传感数据,其规模每每达到了PB(1024TB)级。不合机构对大年夜数据也有不合的定义。

麦肯锡对大年夜数据的定义:一种规模大年夜到在获取、存储、治理、阐发方面大年夜大年夜越过了传统数据库软件对象能力范围的数据聚拢,具有海量的数据规模、快速的数据流转、多样的数据类型和代价密度低四大年夜特性。

移动信息化钻研中间对大年夜数据的定义:大年夜数据是赞助企业使用海量数据(603138)资产,实时、正确地洞察未知逻辑领域的动态变更,并快速重塑营业流程、组织和行业的新兴数据治理技巧。

IDC觉得大年夜数据具备海量(volume)、异构(Variety)、高速(Velocity)和代价(Value)四大年夜特点。

举世大年夜数据储量规模爆发式增长

跟着物联网、电子商务、社会化收集的快速成长,举世大年夜数据储量迅猛增长,成为大年夜数据财产成长的根基。根据国际数据公司(IDC)的监测数据显示,2013年举世大年夜数据储量为4.3ZB(相称于47.24亿个1TB容量的移动硬盘),2018年举世大年夜数据储量达到33.0ZB,同比增长52.8%。

从大年夜数据储量散播环境来看,美国大年夜数据储量占比为21%,EMEA(欧洲、中东、非洲)占比为30%,中国地区占比为23%。

2013-2018年举世大年夜数据储量统计及增长环境

数据滥觞:前瞻财产钻研院收拾

2018年举世大年夜数据储量区域散播环境

数据滥觞:前瞻财产钻研院收拾

流式处置惩罚占主导职位地方,Kafka和Spark成为主流利用

根据数据处置惩罚的时效性,大年夜数据处置惩罚系统可以分为批式(batch)大年夜数据和流式(streaming)大年夜数据两类。此中,批式大年夜数据又被称为历史大年夜数据,流式大年夜数据又被称为实时大年夜数据。

以Hadoop为代表的批处置惩罚大年夜数据系统需先将数据汇聚成批,经批量预处置惩罚后加载至阐发型数据仓库中,以进行高机能实时查询。这类系统虽然可对完备大年夜数据集实现高效的即席查询,但无法查询到最新的实时数据,存在数据迟滞高等问题。

以Spark Streaming、Storm、Flink为代表的流处置惩罚大年夜数据系统将实时数据经由过程流处置惩罚,逐条加载至高机能内存数据库中进行查询。此类系统可以对最新实时数据实现高效预设阐发处置惩罚模型的查询,数据迟滞低。

跟着互联网、谋略机行业快速成长,企业对数据的时效性更加注重,企业利用也徐徐由批处置惩罚数据平台向实时的流数据数据平台转移。以流数据处置惩罚为代表的Spark、kafka大年夜数据系统近年来大年夜放异彩,取代了Hadoop的主导职位地方。

大年夜数据实施流式处置惩罚特征阐发环境

资料滥觞:前瞻财产钻研院收拾

2018年举世主要大年夜数据处置惩罚系统热度排行环境

数据滥觞:前瞻财产钻研院收拾

以上数据滥觞请参考于前瞻财产钻研院宣布的《中国大年夜数据财产成长前景与投资计谋筹划阐发申报》,同时前瞻财产钻研院还供给财产大年夜数据、财产筹划、财产陈诉、财产园区筹划、财产招商引资等办理规划。

责任编辑:周星如



上一篇:易会满:资本市场基础制度改革将引入科创板经
下一篇:没有了