河南要“挖湖”,还是超大超深那种?
发布时间:2021.04.20 来源:中原鲲鹏生态创新中心

爱八卦的谈姐又带来了独家热乎的挨踢圈儿内线消息:咱河南也要“挖湖”了!

真的,这个“湖”建好了,北龙湖、如意湖、龙子湖都要靠边站!

谈姐何以得知呢,因为今天,北京易华录信息技术股份有限公司董事长林拥军就来到了郑州龙子湖智慧岛,与河南信息产业投资运营主体河南信产投沟通“数据湖”项目事宜。


北京易华录信息技术股份有限公司董事长 林拥军(左三)

“数据湖”究竟是什么,缘何如此重要呢?且听谈姐慢慢道来。


包教包会版:先聊聊数据湖是怎么来的


从前,数据少的时候,人们拿脑子记就可以了,大不了采用结绳记事:


后来,为了更有效率的记事和工作,数据库出现了。数据库核心是满足快速的增删改查,应对联机事务。


比如你用银卡消费了,后台数据库就要快速记下这笔交易,更新你的卡余额。
日子久了,人们发现,库里的数据越来越多了,不光要支持联机业务,还有分析的价值。
但是,传统数据库要满足频繁、快速的读写需求,并不适合这种以读取大量数据为特征的分析业务。


于是,人们在现有的数据库基础上,对数据进行加工。这个加工过程,被称为:“ETL” 图片  抽取Extract、清洗转换Transform、加载Load


经过这三步,数据仓库就建好了。
这个“仓库”,主要是为了数据分析用途,比如用于BI、出报表、做经营分析等等。
简要总结下:数据库用于联机事务,通常为小数据量高频读写。


数据库等原始数据,经过ETL加工以后,就被装进了数据仓库。
数据仓库主要用于联机分析业务,通常为大数据量读取。


虽然应用场景不一样,但他们都是结构化数据。
在相当长的一段时间内,他们联合起来,共同满足企业的实时“交易”型业务和联机“分析性”的业务。
随着时代的发展,数据的类型越来越多,人们对数据的需求也越来越复杂。


企业越来越看重这些“大数据”的价值,希望把他们存好、用好。
这些数据,五花八门,又多又杂,怎么存呢?
索性挖个大坑吧!


这就是数据湖的原型。
说白了,数据湖就像一个“大水坑”,是一种把各类异构数据进行集中存储的架构。
你可能会问,为什么不是数据河Data River?
因为,数据要能存,而不是一江春水向东流。
你可能又要问,为什么不是数据池Data Pool?
因为,要足够大,大数据太大,一池存不下。
可能还有人会问,为什么不是数据海Data Sea?
因为,企业的数据要有边界,可以流通和交换,但更注重隐私和安全,“海到无边天作岸”,那可不行。
so,数据湖,Data Lake,刚刚好。


在河南“挖湖”,易华录的“阳谋”


其实,牵手河南信产投建设数据湖,早就不是什么商业秘密,而是易华录一直以来毫不掩饰的“阳谋”。
   在信息安全上升为国家战略的时代大背景下,信产投手握全省首个规模化商用的国产化自主可控云平台黄河鲲鹏云这一重磅王牌,成为易华录构建“天上有云、地下有湖”的数字经济新生态中不可或缺的伙伴。
   早在去年9月的数字经济峰会现场,易华录党董事长林拥军就曾作题为《基于黄河鲲鹏的数据湖:自主可控数字经济底座》的演讲,在演讲最后,林拥军还深情寄望与黄河鲲鹏云的产业合作:“我们完全可以和黄河鲲鹏云深度融合,你中有我、我中有你,实现共赢!”

    林拥军还为双方合作规划了具体路径:在G端业务合作上,易华录将与黄河鲲鹏在黄河云方面深度合作,易华录蓝光存储GDAS平台服务器、数据湖软件将与黄河鲲鹏开展相关技术对接和认证工作,打造国产自主可控的存储产品。林拥军表示,双方将携手夯实国家信息安全战略的“硬基石”,深挖信息领域的“护城河”,构筑国家安全的“高边疆”。

  而除了黄河鲲鹏云,河南信产投手上还有一张王牌——随着中原大数据中心二期即将交付,这个建成后河南最大的第三方数据中心将成为省级政务数据基地、省级大中型企业数据基地和国内大型互联网企业的中部节点,有力提升郑州信息集散中心和通信网络交换枢纽地位,为新一代新兴信息产业发展提供强有力支撑。
  两样“大杀器”在手,让易华录需要信产投这样的区域头部伙伴,共同构建自主可控的数字经济底座。

“建湖高手”易华录

    讲到这里,可能有一些小伙伴还不太了解易华录。
    来康康官方介绍: 北京易华录信息技术股份有限公司,成立于2001年,是国务院国资委直接监管的中央企业中国华录集团旗下控股的上市公司。基于国家大数据发展战略和信息安全保障要求,易华录实施“数据湖+”发展战略,致力于建设城市数字经济基础设施,以努力降低全社会长期保存数据的能耗和成本为使命,以成为社会可信的大数据一级开发和存储服务提供商直至演变成数据银行为愿景,构建一个数字孪生的城市,最终实现数字永生。
    而根据易华录4月12日发布的2020年年报,数据显示,报告期内易华录实现营业收入为28亿元,利润总额为8.12亿元,较去年同期增长55.06%。


    其中,数字经济基础设施落地加速,实现收入16.64亿元,数据运营及服务业务持续提升,实现收入2.37亿元。报告期末,建成并实现运营的示范湖达到23个,2018年落地8个数据湖,2019年落地11个数据湖,2020年落地14个数据湖,数据湖年均增速106%。报告显示,数据湖项目公司平均成立时间不满2年,多已超预期提前盈利。
    不难看出,易华录不仅整体业务发展发迅速,其数据湖业务增长尤为突出。
    根据国际数据公司(IDC)发布的《IDC:2025年中国将拥有全球最大的数据圈》白皮书显示,预计到2025年,中国数据圈的规模将增至48.6ZB,占全球总量的27.8%,成为全球最大的数据圈。而研究表明,所有数据在产生后的14天内,就会变成冷数据或者温数据。这意味着,大数据时代摆在所有闯关者面前一道难题:这些体量巨大、价值密度不高的数据,将如何存储?
    或许,河南这次着手建设的数据湖,能给这个问题提供一些答案。





参考文献:
《一哥闲聊:畅想数据湖》
「地铁短文」3分钟看懂数据湖
数据湖这个大坑,是怎么挖的?
决胜云计算时代 ,这朵云底气何来?
天上有“云”、地下有“湖” 大数据时代长这样!