大数据是个技术,数据库才是它最好的产品形态

星环科技(以下简称:星环)的定位是大数据基础软件公司,而非数据库公司,却在数据库方面,做的比很多数据库公司更好更猛?这是为何?

“我们认为,大数据是个技术,数据库才是它最好的产品形态”,星环科技研发总监刘汪根对笔者说。

很多人也许并不清楚,基于大数据技术的星环数据平台产品家族,是由三个部分组成。

1、分布式数据库产品

2、实时计算平台

3、数据科学平台

很显然,星环的核心竞争力以数据库为主,而数据科学与实时计算平台,在笔者看来,只是对数据技术生态的补充。

从数据库品类来说,星环是国内少有能够覆盖OLAP、OLTP、NoSQL几乎全部数据库品类的厂商。

分析数据库(OLAP),星环有两款产品,Inceptor是基于Hadoop打造的分析数据库,另一个则是专为新一代硬件闪存打造,完全自研的数据库ArgoDB。

二者区别在于,Inceptor用于离线处理、数据仓库业务场景。而ArgoDB则能够满足数据仓库、数据集市混合业务场景。

据刘汪根介绍,ArgoDB能做到一个数据库支撑所有分析类场景。

最近,蚂蚁金服OceanBase登顶TPC-C(OLTP),让国人为之骄傲,也让国内越来越多人了解到TPC。但有很多人或许不知道,早在2018年,星环就通过了TPC的另外一项测试TPC-DS(OLAP),当时,笔者就曾写过一篇文章《通关TPC-DS,中国数据库领域首破纪录诞生!》,有过详细介绍。其中,Inceptor是第一个通过的,ArgoDB在性能测试中也取得了亮眼成绩。

交易数据库(OLTP),星环有KunDB,这个产品起步稍晚,最近2年才开始做,目前功能比较全,而这块未来将是星环投入的重点,主打金融行业并向全行业复制。

NoSQL数据库,星环有3个产品,分别是图数据库StellarDB、文档数据库Search、Bigtable数据库Hyperbase。

据刘汪根介绍,目前,星环分布式数据库在国内的装机量在10万+级别。

上图可以很清楚的看到,星环技术架构由“蓝”变“绿”的变化,从基于Hadoop到超越Hadoop,再到完成自主重构,星环用了6年。

星环为什么要放弃Hadoop技术路线,进行自主重构?星环创始人孙元浩说,有三个原因。

其一,Hadoop是十几年前的技术,其架构基于当时的硬件环境设计,当时的硬件是低速硬盘,百兆都算高速网络了,而现在已经是万兆,因此,Hadoop现在已经完全跟不上硬件的发展。

其二、星环一直试图将Hadoop做到极致,但在高性能高并发的情况下,总是碰到问题,没法突破,这是由Hadoop自身架构决定的,因此,改来改去还不如重新写。

其三、星环需要更多的突破与创新,需要世界领先。

实际上,从基于Hadoop到超越Hadoop,星环所说的持续世界领先并非空口白话。

2014年,星环第一个在Hadoop上做分布式事务管理,这样做的价值在于,可以大规模应用在金融等重点行业,目前,有200多家金融客户在使用星环的产品。

2015年,星环在流计算产品上提供SQL开发接口,这也是世界第一。因为,该技术在Hadoop社区现在才开始普及。也是在这一年,星环第一个做了低延时高吞吐的融合计算引擎。

2017年,星环第一个把大数据和分布式系统放到容器里。而今年,谷歌才刚发布类似的产品,Hadoop社区,到现在还没有做。

2018年5月,星环通过TPC-DS测试,成为TPC-DS测试从2006年制定后,12年来全球首个完整通过测试,并得到TPC组织审核通过的大数据平台,这标志着星环科技的数据库产品已经处于世界的领先地位。

多模态数据存储,星环攻克了万亿级的文档类数据库技术,能做到万亿级数据搜索秒级返回,万亿级图数据分析能力等等。正是因为星环不断的突破,多处世界领先,让星环被资本持续看好。

2014年8月,星环完成A轮融资,2015年2月,完成A+轮融资,2016年3月,完成1.55亿B轮融资,2017年,完成2.35亿C轮融资, 2019年2月,完成D1轮数亿元融资,10月,完成5亿元人民币D2轮融资。

参与星环两轮投资的中金资本董事总经理张清的表态就很说明问题,他说:“星环在核心基础软件领域历时六年自主研发,实现了分布式核心软件的重构,产品和技术达到了世界领先水平,并且引领了大数据技术的发展方向。星环的产品布局广泛,覆盖了数据库领域的各个产品品类,并能持续保持创新和技术领先。“

完成D2轮融资,星环离上市还远吗?这可能是很多人关心的问题。孙元浩对笔者表示,上市与否将会根据公司的发展需要来决定,目前的重心还是在业务发展和产品研发上。

据孙元浩介绍,本次融资,钱主要投在三个方面,一是产品研发,虽然星环覆盖了全品类的数据库,但相比Oracle代码量级,还有差距,星环的目标,是希望成为世界级的领先技术软件厂商,因此,研发投入还需要加大。

第二,在市场投入还要加大,目前,星环已经拥有超过1600家客户,过去一年,星环覆盖了20多个行业,在某些细分市场份额甚至超过70%。

第三,是生态投入,在孙元浩看来,基础软件产品需要一个大生态来支撑,星环将采取“平台+生态”战略,进一步加深生态建设。

Image placeholder
Fenzland
未设置
  51人点赞

没有讨论,发表一下自己的看法吧

推荐文章
专访腾讯云数据库负责人丁奇:打造超越用户想象的产品

“就市场份额来说,腾讯云在国内还不是第一名,但从国内上云企业比例看,剩余的还有很多,因此,大家都还有机会,就看谁能真正解决用户的痛点。”                                

软件定义IT基础架构,如何看待深信服的产品战略布局?

在很多人的潜意识里,深信服是一家令人尊敬的企业,技术支撑能力强,产品种类多,功能全面,后劲足,是少数能和华为、新华三同台竞技的企业之一。但有时候,深信服也会被这些优势所累,比如经常会被问道:你们和华为

这些高阶的函数技术,你掌握了么

课程推荐:Java开发工程师--学习猿地精品课程 在JavaScript中,函数为一等公民,所谓的“一等公民”,指的是函数与其他数据类型一样,处于平等地位,可以赋值给其他变量,也可以作为参数,传入另一

大数据时代,数据湖并不能完全取代数据仓库

数据仓库为组织了解其历史业务表现和推动持续运营提供了一个接入窗口,为数据分析师和业务用户提供了诸如客户行为、业务趋势、运营效率和销售等方面的信息。尽管出现了基于Hadoop和其他一些大数据技术的数据湖

GitHub上十大很火的Python项目,最后一个竟然是它!

课程推荐:Python开发工程师--学习猿地--送9个上线商业项目 作为程序开发人员,GitHub是大家平时必逛的网站,GitHub作为目前全球比较大的男性同性交友平台,上面存在着太多太多的宝藏程序。

架构师眼中的文化:试用期才是真正的考察时间

如果说架构师在技术上的沉淀称为“武”,那么对于文化的感知和影响、对于团队的带动和辅导、以及多角色沟通等可以称为“文”,文武兼备,才是好架构!管理风格团队是由个体组成的,管理风格往往能够显示出团队文化。

制定机器学习训练数据策略的6个技巧

人工智能(AI)和机器学习(ML)如今已经十分常见。AI指的是机器模仿人类进行认知的概念,ML是一种用于构建AI的方法。如果AI是指计算机可以根据指令执行一组任务,那么ML就是机器从数据中摄取、解析和

谁不想写出干净的代码?7 个技巧,让你的同事爱上你的代码

推荐课程:融职教育--web全栈开发就业班(含价值500万10个商业项目) 1使用有意义的变量命名使用有意义的名称,这会让你一眼就知道是什么意思。//不推荐letxyz=validate(‘amyja

为什么学编程?9个理由告诉你编程是最好的工作

  为什么要学习编程?可能大部分给出的答案就是因为开发工作的薪资高啊。的确这是学编程开发的原因之一,但这并不是全部的答案,下面将为大家提供9个理由告诉你编程才是最好的工作。也许你会改变对编程的看法。

可能是全网最好的MySQL重要知识点

什么是MySQL?MySQL是一种关系型数据库,在Java企业级开发中非常常用,因为MySQL是开源免费的,并且方便扩展。阿里巴巴数据库系统也大量用到了MySQL,因此它的稳定性是有保障的。MySQL

可能是东半球最好的 Curl 学习指南,强烈建议收藏!

简介curl 是常用的命令行工具,用来请求 Web 服务器。它的名字就是客户端(client)的 URL 工具的意思。 它的功能非常强大,命令行参数多达几十种。如果熟练的话,完全可以取代 Postma

面试题总结:可能是全网最好的MySQL重要知识点

作者:Snailclimb 整理编辑:SegmentFault本文原载于SegmentFault专栏JavaGuide,如侵删。标题有点标题党的意思,但希望你在看了文章之后不会有这个想法——这篇文章是

2019年度IT168技术卓越奖名单:大数据类

随着对数据价值的不断挖掘,以及全球各地区政府的政策支持,大数据市场呈现出一片欣欣向荣的发展态势。IDC在其几个月前发布的报告中曾预测,2019年全球大数据与商业分析解决方案市场的整体收益将达到1896

地震局网络安全观:数据是核心,合规是基线

近年来,我国地震多发,大小地震给震区人民带来了不小的恐慌和经济损失。而前不久的四川宜宾地震期间出现了一个小插曲让大家记忆犹新:成都市地震预警系统在地震到达成都前提前触发警报,成都市13个区县电视预警系

5G是一个数据通道,未来最大的产业是人工智能 | 任正非对话卡普兰

大数据文摘出品昨天下午,华为创始人任正非邀请两位人工智能领域的国际顶级专家参与“与任正非咖啡对话”。这已经不是任正非第一次举办这种与行业专家的对话,上一次是在6月17日在与《福布斯》著名撰稿人乔治·吉

从关系型数据库到分布式机器学习,揭秘腾讯大数据十年发展历程

大数据技术在过去10多年中极大改变了企业对数据的存储、处理和分析方式。如今,大数据技术逐渐成熟,涵盖了计算、存储、数仓、数据集成、可视化、NOSQL、OLAP分析、机器学习等丰富领域。在未来,大数据技

2019年度IT168技术卓越奖名单:网络产品类

当时间的指针快速划至2019年末,企业网络市场仍在变革中砥砺前行。在这充满机遇与挑战的一年里,工信部正式发放了5G商用牌照;Wi-Fi联盟启动Wi-Fi6认证计划;全球43亿个IPv4地址完全耗尽;S

借力中国数据库技术大会 达梦DM8数据库新品正式发布

5月8日—10日,第十届中国数据库技术大会(DTCC2019)如约而至。本届大会以“数据风云,十年变迁”为主题,设定2大主会场及21个技术专场,邀请了来自国内外互联网、金融、教育等行业百余位技术专家,

做银行家里的数据专家:ING探索大数据时代下的金融最佳实践

大数据文摘出品记者:高延6月18-21日,O’ReillyAIConference在北京召开。大会上,来自荷兰的金融公司ING的IT主管BasGeerdink带来了《关于数字驱动企业》的主题分享。进入

2019年,数据中台为什么火了?

2019年,“数据中台”火了!一方面,过去一年BATJ、TMD等新老互联网巨头前后脚地发布重大消息,称集团层面正在推动以搭建中台为目标的组织架构变革,其中数据中台将是重要一环。而远在2015年就提出“

包银消费CTO汤向军:消费金融大数据风控架构与实践

01风险在哪里1.1 信用风险根据银行业的风险理论,信用风险是指借款人因各种原因未能及时、足额偿还债权人或银行贷款而违约的可能性。信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款意愿

耗时6年生成代码1.6亿行,农业银行大数据平台打造攻略!

摘要: 耗时6年,135个项目,8000页需求,累计投入11000多人月,生成的代码行1.6亿行,支持了8大业务领域,33条业务线,120多个应用场景,这就是中国农业银行大数据平台。近日,中国人民银行

大数据推动教育产业创新发展

《大数据时代》作者维克托•迈尔-舍恩伯格教授著作《与大数据同行:学习和教育的未来》一书指出:当下大数据正悄悄影响到教育体系的每个层面,对于全世界的学习与教育活动,都会产生极为深远的影响。AI辅助教学,

大数据对移动应用开发的影响

大数据如何影响移动应用程序开发?目前,数据量正以前所未有的速度在增长。由于产生的总数据将在几年内跨越泽字节级别,因此更加需要进行大数据高级分析,并从庞大的数据池中获取有价值的信息。数字互联为移动应用开

建立开放的大数据精准扶贫平台,让全社会参与进来!

精准扶贫”的重要思想最早是在2013年11月,习近平主席到湖南湘西考察时首次作出了“实事求是、因地制宜、分类指导、精准扶贫”的重要指示。2015年6月,习近平主席在贵州召开部分省区市党委主要负责同志座