2022爱分析· 中国分析型数据库市场研究报告 | 爱

网络知识 2022-06-29 08:40www.1681989.comseo网站推广

报告编委

爱分析

黄勇 合伙人&首席分析师

张扬 合伙人&首席分析师

洪逸群 高级分析师

任理 分析师

中国信通院云大所

魏凯 中国信通院云计算与大数据研究所副所长

序言

数字化时代,数据使用场景呈现多元化趋势,数据规模也随之爆发式增长。海量异构数据的爆发式增长,对数据库的存储和计算能力提出了更高的要求。分析型数据库因其在处理海量实时数据时具有优秀的存算和管理能力,近年来赢得了市场的青睐。

分析型数据库最早的定义是指从分散的数据源中抽取、清理和汇集各类结构化数据,形成面向特定分析主题的、相对稳定且能反映历史变化的数据集合,并通过OLAP(联机分析处理引擎)来对这些数据进行分析,即通常意义的数据仓库。其中OLAP数据库概念最早由关系型数据库之父E.F.Codd于1993年提出,他认为用户的决策分析需要对关系型数据库进行大量计算才能得到结果,OLTP(联机事务处理)已经不能满足终端用户对数据库查询分析的需要,,E.F.Codd提出了多维数据库和多维分析的概念。OLAP数据库的提出引起了很大的反响,OLAP数据库作为一类产品同OLTP数据库明显区分开来。

在此后近30年的演进中,分析型数据库先后出现了共享存储架构数仓、大规模并行处理(MPP)架构数据仓库以及数据湖等技术架构。近年来,随着企业数据分析需求的不断提升,具有流批一体和存算分离,能通过元数据层在数据湖上实现数据管理功能的智能湖仓受到了更多关注,分析型数据库迎来新阶段—智能湖仓。伴随企业数字化转型战略深入推进,分析型数据库内涵也在不断扩展,我们认为当下的分析型数据库是指为应对企业管理、业务、数据分析师、数据科学家等人员对数据的各类分析和应用需求而提供的各类数据存储和计算引擎,包括传统数据仓库、云数据仓库、数据湖等,以及目前正在兴起的智能湖仓。

后疫情时代背景下,分析型数据库在更多业务场景中实现了更广泛的应用,如流调溯源、时空分析等,分析型数据库市场也迎来了爆发式增长。近些年国内分析型数据库创业公司日益涌现,产业资本不断涌入,获得融资的公司数量及额度均大幅增长。据公开资料统计,2013-2021年,主打数据分析场景的数据库企业成立数量为11家,占总数据库企业总成立数量的24%,融资次数共计约40余次,融资总额约近50亿元人民币。竞争激烈的市场,哪些公司具有真正潜力;当前火热的市场是否只是一场泡沫;“智能湖仓”阶段后,分析型数据库又将向哪个方向发展,本报告将进行一一梳理和详细解答。

魏凯

中国信通院云计算与大数据研究所副所长

前言为什么要研究分析型数据库

随着数据成为驱动社会与经济发展的核心生产要素,作为关键数字基础设施的数据库,其技术趋势和市场格局正在经历剧烈的变化。

一方面,数据规模的迅速膨胀,以及大量创新性的数据分析和应用场景的出现,对分析型数据库的存储和计算能力也提出了更复杂的要求。

另一方面,为应对新的趋势,国内外传统数据库厂商、新锐数据库厂商和公有云厂商等各类厂商近年来纷纷加大对分析型数据库的投入和布局,它们或推出了新一代的智能湖仓产品,或对传统的数据仓库、数据湖进行了重大升级。

变化也意味着机遇,为了挖掘出该领域具备潜力的代表性公司,本报告将详细梳理分析型数据库的发展历程和技术演进趋势,重点阐明中国分析型数据库市场的价值和发展空间,建立分析型数据库厂商的评估模型,并对重点公司的产品技术、研发能力、商业模式、行业落地情况进行分析。

一、分析型数据库的定义与发展历程

分析型数据库的诞生

分析型数据库最早是从交易型数据库衍生而来。在数据库诞生和发展的早期,其应用场景主要是对数据进行统一的存储、管理和访问,用户需要数据库能够实现对数据的增改删操作,也即联机事务处理(OLTP),此类数据库被称为交易型数据库(也称事务型数据库)。随着用户的需求从查看单个交易数据逐渐衍生出对交易数据的汇总、对比等分析需求,数据仓库在1980年代开始出现。一直到1993年,关系型数据库之父 Edgar F. Codd正式提出联机分析处理(OLAP)的概念后,分析型数据库的概念也由此正式诞生。

分析型数据库的定义及其延伸

分析型数据库最早的定义的是指从分散的数据源中抽取、清理和汇集各类结构化数据,形成面向特定分析主题的、相对稳定且能反映历史变化的数据集合,并通过OLAP引擎来对这些数据进行分析,也即通常所说的数据仓库。

随着企业数据分析需求的不断变化,以及技术的持续演进,分析型数据库的定义和内涵也在不断延伸。我们认为,当下的分析型数据数据库是指为应对企业管理、业务、数据分析师、数据科学家等人员对数据的各类分析和应用需求而提供的各类数据存储和计算引擎,包括了传统的数据仓库、数据湖,以及目前正在兴起的智能湖仓。

分析型数据库的发展历程

分析型数据库已经经历了数十年的发展,期间伴随了多个关键概念的提出,以及众多厂商推出的重要产品,这些事件成了串联分析型数据库发展历程的关键节点,也大致勾勒出了分析型数据库的演进趋势。

图1: 国内外分析型数据库发展历程重要节点

2. 分析型数据库的技术演进趋势及其驱动因素

分析型数据库诞生至今,已经经历了共享存储架构数据仓库、MPP数据仓库、数据湖三代的发展,目前正在往第四代智能湖仓方向演进。在这一发展历程中,驱动分析型数据库代际演进的因素主要包括了应用场景、数据以及计算环境三个层面不断发生的变化,也由此造成几代分析型数据库在技术架构、功能和性能层面的根本差异。

表1分析型数据库的代际演进

第一代分析型数据库——共享存储架构数据仓库

Copyright © 2016-2025 www.1681989.com 推火网 版权所有 Power by