12月7日,IDC研究针对能够提供数字政府领域大数据管理平台产品的厂商进行综合评估,正式对外发布了《IDC MarketScape:中国政务大数据管理平台市场厂商评估,2021》报告。报告选取了阿里云、烽火(600498.SH)、华为、浪潮、联通数科、腾讯云、中国系统、中兴(00763)、紫光进入本次研究报告,厂商评估结果基于IDC MarketScape模型以图像的形式呈现。其中,阿里云、华为、浪潮、紫光在能力与战略维度表现强势,进入领导者位置;烽火、联通数科、腾讯云、中国系统、中兴处于主要厂商位置。
通过对本次报告的研究,IDC总结出该市场的几大现状:
区县一级项目逐渐增多
政府的大数据建设以支撑政务服务、放管服改革为主,前期的建设已经覆盖到了省级和地市级。作为国家大案例推进基层审核会治理、落实街道社区管理的区县一级市场,在20年疫情防控中得到了进一步的拓展。
存算分离方案的应用场景不多
当存储资源和计算资源的利用率不同,使用存算一体的方案时,存在资源浪费的情况。存算分离方案可以实现客户在需要扩容的时候按照计算资源、存储资源分别扩展,降低使用成本。目前,尽管在部分政府类项目中有视频类数据接入的场景,会占用大部分的资源,但是需要实际分析的数据多为结构化的数据,尤其没有到PB级以上,存算分离的利用价值不高。
技术异构导致数据不流通
云计算和大数据方面的异构,会导致新的数据孤岛,不利于数据的流通。尤其,当存在多云平台下的大数据技术架构的异构时,会出现更加复杂的情况。这种现象不局限于跨省跨部委层级中,也出现在一个部委中不同的部门中。
湖仓一体是在存算分离基础上实现逻辑上给业务人员统一的管理视角
湖仓一体的核心是既满足架构灵活,又能够去利用数仓的企业级能力。数据湖最大的优势在于利于数据的存储,但是在管理过程时只使用ranger,不能很好地处理大量的表单数据。目前的主流技术是针对任务流动实现很好的控制,实现“湖”与“仓”的算力统一与合理分配。典型的场景是在“湖”的数据与“仓”的数据需要融合的时候,通用的实现方式是元数据的统一,将计算引擎与存储引擎在逻辑层面切分开,分配好相应的平台算力,以期将湖中的数据实现更好的整理与规范,最终达到与数仓一样具备高可用的能力,给业务人员统一的视角。
Flink技术对于在线机器学习有很好的支撑
Flink技术对于政府业务本身的状态和流程的管理暂时没有很多的场景能够支撑,但是在对于机器学习的在线模拟训练和分析方面具备天然的优势。Flink可以作为数据处理的中枢,将多种算法挂载到Flink流中,增加整个流程的客观可控性。