专访陈应东:所有信息化,都离不开数据库
发布时间:2020/4/7 来源:时空杂志 阅读:16123
分享到:

  作为中国最早一批研发空间数据库的技术人员,陈应东认为,空间数据库将在未来的5G、物联网、人工智能的推动下迎来全新的发展机遇。采访过程中,他提出的两个比喻让记者印象深刻,一是数据库就像是硬件中的芯片,虽然处于底层但至关重要。二是数据库就像是图书馆里的管理员,藏书再多也要能够找得到才管用。

  本期《时空》对话北京博阳世通信息技术有限公司总经理陈应东,探寻作为数据时代底层基础设施的数据库,究竟在发挥着怎样的作用?独特的空间数据库又在经历着怎样的转变?

  《时空》:博阳世通名字的由来?

  陈应东:博阳是我们取自英文“Beyond”的谐音,寓意是通过我们的自主研发超越现有技术和产品。世通则是“世界通用”的简写,当时我们希望我们的数据库能够被所有人使用。两个词合起来,就是说我们想要做出让全世界人都使用的,领先的数据库,即博阳世通。

  《时空》:能否简单的解释一下,数据库、数据管理平台以及数据中心,这三者之间的区别和关系是什么?

  陈应东:数据库本质上其实就是一种用于储存数据的基础性软件。而数据管理平台,大家可以简单理解为是在数据库的基础上加入了一些管理功能的软件系统,更加方便用户的使用。

  但数据中心和前两者的定义就不太一样了,一般我们将数据中心更多的定义成为是一个实体的事物,可以是一栋楼或者是一个机构或部门,但不是信息化和软件的概念。

  在这我想举个例子大家更容易理解。数据中心就好比是一座图书馆(没有电脑),它既代表着一个实体建筑,也代表了一个单位或者是一项业务。这座图书馆里的书架数量以及能够存放书籍的空间,其实就相当于是现在我们用的机房和服务器,属于硬件设施。

  而数据库,其实就是传统图书馆中的图书管理员,他们负责把这些书籍(数据)分门别类的存放好,并且能够整理成目录方便以后及时找到。再说数据管理平台,则相当于是图书馆中设立的服务窗口,负责借阅、归还等服务。

  其实用的还是管理员(数据库),但是它又实现了一些除了储存以外的其他功能,比如调取、录入、管理等等。为的就是能够让不熟悉图书馆书籍存放方式(数据库软件)的人也能快速找到想要的书(数据)。

  《时空》:作为这个领域的专家,您如何定义空间数据与空间数据库?而空间数据库与主流的数据库究竟又有哪些区别?

  陈应东:其实,随着时代的发展大家对这些定义的理解也发生了很大变化。以前我们认为,空间数据实际上就是地理空间数据,讲的就是通过测绘在地球表面所获取的数据,经纬度坐标或者是带坐标的影像。

  但现在普遍的共识是,只要是带有空间属性的数据,都可以认为是空间数据。这样判断的话,几乎百分之百的数据都带有一些时间或空间属性。那么,能够对空间数据进行储存和计算的数据库,或者是以处理空间数据为主的数据库,我们就会称之为是空间数据库。

  空间数据库与主流数据库最主要的区别,就体现在针对空间数据的存储能力和计算能力上。就目前来讲,空间数据库在这两方面占有绝对的优势。

  这主要源于空间数据库内核算法中就支持对空间数据以及非结构类数据的运算处理,而大多数主流数据库采用的是外部连接空间引擎的方式,这使得后者的流程繁复以至于效率明显低于空间数据库。

  这里也举个例子,比如我想要调取某一时段在北京某个小区发生的交易数据。主流数据库会通过空间引擎查询所有数据的空间位置信息,计算是否匹配该小区的坐标范围,然后找出坐标对应的数据。

  而空间数据库,因为自身就支持空间分析能力,所以直接用该小区的空间范围与数据库中的数据做一个简单的拓扑分析,即可快速找到被该小区覆盖的所有数据点。两者之前的底层算法可能是一样的,但是对于空间的理解不同,所以体现在空间数据的处理能力上也就自然天差地别。

  《时空》:空间数据库与主流数据库,未来两者会以什么样的关系继续发展?

  陈应东:这其实是我们一直也在讨论的一个问题,即空间数据库以及数据库未来会如何发展?数据库技术从上世纪60年代诞生至今,发展出了包括关系数据库、对象数据库等多种类型,每一类数据库也都有各自的优势和不足。

  对于未来的数据库形态,我个人比较倾向于相信它会向着高度融合的方向发展,无论是现在主流的关系型数据库,还是空间数据库,未来或许都会结合成一体、各取所长。因为我们认为,纯粹一种数据库是不可能满足所有的需求的。所以将来的一个数据库或者数据管理平台,可能会用到很多种数据库,这其中自然也包括空间数据库。

  《时空》:目前看来,在整个空间信息产业链中数据库只占了很小的产值份额,您对这种情况怎么看?您认为空间数据库应该在这个产业中发挥什么样的作用?

  陈应东:我个人认为,目前无论是在国内还是国外,数据库的发展都还是非常健康的。数据库的产值或者是市场规模,这跟它的自身定位与商业模式有关,但不能代表数据库在整个信息时代的价值和重要性。

  我常用的一个比喻就是,数据库在软件中的地位,其实就相当于芯片在智能硬件中的地位。它直接关系到后端的软件系统好不好用,以及整个信息化工作能否稳定安全的运行。

  所有的信息化软件都离不开数据,所以,所有的信息化也都离不开数据库。再细点说,现在我们经常讲的大数据、云计算、智慧城市、人工智能、物联网,哪一项不跟数据有关。

  这些数据都不是写着纸上记在脑子里的数据,而都是储存在数据库的数据,这样才能够被检索、调取、分析。所以,所有的信息化工作,背后其实都有着数据库的支撑。但它真正能卖多少钱,或许还真的不多,甚至会比芯片在硬件中的占比还低,但它依旧不可或缺。

  《时空》:作为数据库厂商,如何打破数据库的天花板?

  陈应东:数据库的商业模式存在很强的特殊性,特别是在国内。目前主要表现为两点:一是国外数据库产品通过先发优势造成了垄断,二是用户对数据库的产品需求逐渐转化为服务需求。

  像Oracle、SQL Serve、DB2这样的老牌数据库产品,由于推出时间早,打下了坚实的用户基础,甚至在一定程度上成为了行业的标准。就像Windows系统在PC领域的地位一样,后来者很难超越,所以这也就是国内数据库厂商难做的主要原因。

  其次,因为数据库这个东西它不能直接产生信息化结果的,本质上它是一个配套性的、基础性的软件。所以,现在的用户对数据库产品的需求越来越弱,反之则对服务的需求逐渐增强。

  以博阳世通近两年的销售情况为例,单纯通过销售数据库产品获得的收入,占总体的比重已经非常小了,反倒是通过承接整体的信息化项目的营收也快速增长。

  如今市面上也很少能够见到某一家企业或者是政府单位单独采购一套数据库,基本上都是一整套信息化项目的招标。所以对于数据库厂商来说,以数据库当作基础,逐渐将业务延伸至应用前端,或许会是打破企业天花板的重要方式之一。

  《时空》:AI、大数据分析大行其道的今天,空间数据库的发展趋势有哪些?博阳世通又为此做了哪些准备?

  陈应东:未来,5G时代以及物联网时代的到来,会使得AI和大数据分析越来越普及。与此同时,可预料的是需要储存和处理的数据量会急剧增加,对于数据库的需求和要求也会再提升一个量级,我们也面临着相应的机遇与挑战。

  其中挑战主要是对于数据库自身技术的要求,这方面博阳世通自2010年成立以来一直坚持自主研发,积累了许多的技术经验,也为应对海量数据的精细化处理做好了充足的准备。而在我看来,未来的5G时代对于我们来说可能是机遇大于挑战,机遇就在于我们掌握着对于空间数据处理的优势。

  在现在的这个数据体量下,很多时候空间计算的能力还显现不出来。但当5G、物联网这个时代真正到来的时候,数据中空间属性的重要性就会越来越高,对于空间数据处理能力的需求也会越来越大。届时,具备强大空间数据处理能力的数据库产品的价值就会显现,而忽视这方面能力和积累不足的数据库产品一定会死掉,这就是大势所趋。

  当然,已经有很多人意识到空间数据的重要性,比如阿里巴巴和京东,他们都已经在自己的数据库中加入了空间分析的模块,并且在基础架构设计中就已经开始重视空间属性的作用。

  所以,对于空间数据的处理能力,一定将会帮助博阳世通在未来的时代占据一席之地,我们也在期待着那个时代尽快到来。