海盒大数据平台SDP

海盒大数据平台提供大数据的基础能力,包括分布式存储、分布式计算,集成了多个大数据基础组件、数据规划、可视化部署运维、资源管控、数据分析、数据安全等,满足不同业务场景,提高易用性,为企业级客户提供高性能的一站式大数据产品解决方案。

产品概述
海盒大数据平台(SDP)提供大数据基础能力,旨在帮助企业和组织高效地存储、处理和分析海量数据,从而提高决策效率和业务洞察能力。SDP集成和二次开发了多个大数据基础组件,包括数据接入、分布式存储引擎(HDFS分布式文件系统、Hive数仓管理、HBase存储服务、Kafka消息队列、MinIO对象存储管理、Redis内存数据库管理、ES多集群管理等)、分布式计算引擎(Yarn计算资源管理、Hue离线开发、Flink实时开发、Clickhouse列式数据库开发、联邦查询等)、分布式分析引擎(Kylin多维分析、Spark MLib机器学习、OrientDB多模数据分析、Kibana数据可视化)、任务调度(DolphinScheduler)、数据安全(FreeIPA/LDAP/用户管理/租户管理/项目管理、Kerberos票据下载、Ranger访问管理)和部署运维(Ambari集群管理、Prometheus监控告警、LogSearch日志中心、Nginx反向代理)等多个功能模块。SDP可满足不同规模和业务需求下的湖仓一体和流批计算的大数据处理和分析需求。
场景
主要功能
简易操作和管理
支持产品便捷部署、组件一键升级和图形化运维,并提供了异常告警和可视化健康监测功能,帮助用户简化运维过程。
多渠道数据集成
支持结构化、半结构化、非结构化的异构数据秒级实时接入;主流关系数据库高效导入,支持文本类日志数据离线导入。
海量数据存储
支持分布式文件、NoSQL从GB到PB量级的存储解决方案。高可扩展设计,存储系统可动态随数据量增加从G到P级的动态扩容,支持系统不停机动态扩容、负载均衡等。
一站式数据开发
提供贯穿数据全流程的数据开发平台,集数据集成、存储、处理、分析、探索、挖掘、监控到数据可视化一体化能力,实现闭环的数据业务开发全流程。
计算性能优异
集成交互式SQL、实时内存计算、流式计算、全文检索等技术,实现多数据源、多数据场景及多数据模型的联合计算平台,比传统型数据仓库和开源版分布式架构计算效率提升10倍以上。
平台灵活应用
外部链接标准化快速接入平台,实现系统功能线性扩展,可按实际情况申请使用,完成用户打通,最大程序满足业务应用需求。
核心优势
简易运维部署
支持产品便捷部署、组件一键升级和图形化运维,并提供了异常告警和可视化健康监测功能,帮助用户简化运维过程。
多渠道数据集成
支持结构化、半结构化、非结构化的异构数据秒级实时接入;主流关系数据库高效导入,支持文本类日志数据离线导入。
海量数据存储
支持分布式文件、NoSQL从GB到PB量级的存储解决方案。高可扩展设计,存储系统可动态随数据量增加从G到P级的动态扩容,支持系统不停机动态扩容、负载均衡等。
一站式数据开发
提供贯穿数据全流程的数据开发平台,集数据集成、存储、处理、分析、探索、挖掘、监控到数据可视化一体化能力,实现闭环的数据业务开发全流程。
计算性能优异
集成交互式SQL、实时内存计算、流式计算、全文检索等技术,实现多数据源、多数据场景及多数据模型的联合计算平台,比传统型数据仓库和开源版分布式架构计算效率提升10倍以上。
多模数据管理
支持业界主流的多种存储模型管理,包括宽表数据库管理、缓存数据库管理、分析型数据库管理、时序数据库管理、消息队列管理、ES集群管理等在内的多种数据存储模型管理。
平台灵活应用
外部链接标准化快速接入平台,实现系统功能线性扩展,可按实际情况申请使用,完成用户打通,最大程序满足业务应用需求。
应用场景
数据汇聚场景
湖仓建设与数据分析场景
数据搜索分析场景
重点面向政务及企业,海盒大数据平台提供完整的产品解决方案,基于数据的汇聚存储,进行数据开发、处理等操作,满足客户在大数据阶段的不同需要。
面向金融、交通等行业,海盒大数据平台提供数据集成和开发处理,完成数仓、数据湖的建设,搭配丰富的服务组件支持,满足实时的数据分析需求。
面向工业能源等行业,海盒大数据平台通过数据搜索分析,完成海量数据的查询分析,支持日志分析、安全监控、可视化等多种应用场景。
客户案例