GBase HD 是南大通用GBase全栈数据库(gbase database)产品矩阵中的一站式大数据基础平台。它将 Hadoop 生态核心能力与自研MPP数据库GBase 8a融为一体,覆盖采集 → 存储 → 计算 → 管理 → 应用全链路。
GBase HD的四大差异化特性:
1、存算分离,不为闲置资源买单
存储节点专心存,计算节点专心算,独立扩展各取所需。同时支持 HDFS on S3 对象存储,进一步降低成本。
2、流批一体,同时搞定离线+实时
不管 T+1 还是 T+0,一套平台全覆盖(All in SQL)。
内置多模计算引擎矩阵,告别两套代码、两套运维:
MapReduce引擎:磁盘级离线,应对大规模 ETL场景。
Spark引擎:内存级微批,应对交互式分析场景。
Flink引擎:内存级实时流,应对实时报表 / 风控场景,
3、湖上格式四合一,不做选择题
Hive、Iceberg、Hudi、Paimon 四种主流湖上格式全部原生支持,同一平台共存互操作。
4、自研MPP融入,仓湖一体非空话
市面上很多大数据平台本质还是“Hadoop 发行版”。GBase HD 不同——自研 MPP 数据库 GBase 8a 深度融入:
• 一张 SQL 同时查数据湖 + 数据仓库
• GBase 8a 做 OLAP 重分析,Spark/Flink 做历史/全量探索
• 引擎间数据高效流通,消灭“数据孤岛”