《科创板日报》(上海,记者 金小莫)讯,5月20日,人工智能企业达观数据上线新产品财债通,目标客户为券商、证券交易所等金融类企业。《科创板日报》记者注意到,达观数据近期刚宣布完成2.7亿元B轮+融资。

据公开资料,达观数据成立于2015年底,是一家NLP(记者注:即自然语言处理技术)+RPA(记者注:即流程自动化机器人)研发企业。据达观数据创始人、CEO陈运文表示,其客户已有中国银联、深交所、新华财经等龙头企业。

NLP在业内被誉为“人工智能皇冠上的明珠”,搜狗、腾讯、科大讯飞等巨头企业均有相关业务,但因其商业化能力疲弱而备受争议。初创企业达观数据是如何完成学术攻关与商业化?就此,《科创板日报》记者对陈运文进行了采访。 机器可换初级财务

对于前述问题,陈运文认为,“将自然语言处理的学术思想和工程实践相结合,实事求是的选择方法解决问题,才能真正发挥它的价值。” 随即,他向《科创板日报》记者展示了其demo产品,并称:“软件产品这样你可以有直观感受。”

首先,他在运行界面上传一份某企业招股书,经过算法读取后,运行界面右侧边栏标示出部分疑似错误数据。“这可能是算错了,也可能是数据内部的逻辑错了,计算机可以提示给财务,减少财务的工作量。”陈运文解释说。

像财务报表这样严谨的操作规范还会犯这样低级的错误?对于记者的疑惑,陈运文解释,此工具是为财务报表在“出厂”时进行检验用的,也可为财务报表接收方在“进厂”时进行初步核对。

“其实这个业务最早是客户向我们提出的需求。此前,我们也不知道它的错误率可以这样高,比如财务数字间逗号点错、与英文句号混淆、错别字等等。”陈运文说,这些错误如果让人来“纠错”是一项“非常反人性的工作”。

据比对数据显示,同样的工作如果交给人类来做,需要花几小时,机器只要几分钟,准确率为98%。

金融领域或是翘板

与前文所述巨头企业选择2C商业模式不同,达观数据在一开始就选择了2B,且将金融类龙头企业作为主要服务行业之一。

“首先,领域越细分与巨头的正面竞争就越少,这有利于初创企业生存。其次,选择金融一是因为其固有的信息化水平远高于其他行业;二是因为金融业务有其固定的规则,算法较易切入;三是这类企业对降本增效有刚需。”陈运文说。

同时,该客户群体属性也必然会出现客户过于强势的现状,进而使企业的市场开拓面临一定不确定因素。

对此,陈运文表示,在刚接触一些政企客户,其确有一定“不信任感”,而信任感的建立需要时间。为此,达观数据做了两件事:一是选择避开微软底层开发框架,完全使用自主研发;二是于2019年将业务线从NLP与RPA领域进行了融合。

一方面满足了金融企业对“自主可控”的要求;一方面则可在客户企业数据库不开放的前提下,让机器自动录入信息,从而完成数据读取、信息审核,报表填写与校对等工作。

“达观RPA产品是市场上唯一不采用微软底层开发框架的产品,虽然研发代价更高更困难,但是回头来看是非常值得的。”陈运文对《科创板日报》记者表示。

盛大系创业

具体到企业经营层面,达观数据未透露具体财务数字,但表示其营收在稳健增长中。《科创板日报》记者从团队成员及专利数方面进行简要分析。

其创始人陈运文系复旦大学计算机技术专业博士毕业,曾就职于盛大文学首席数据官、腾讯文学高级总监等。 据天眼查,达观数据核心成员出自盛大创新院,后者系陈天桥于2008年打造的创新孵化器,云知声、WiFi万能钥匙、UCloud等创始人均出自该孵化器。

至于专利方面,据达观数据披露,其在文本语义分析技术方面拥有100多项技术发明专利和软件著作权。“NLP的基础科研的突破一定在于科研院所。”陈运文说,达观数据与北京大学、复旦大学、交通大学等高校展开了产学研合作。

《科创100》是科创板日报专注科创领袖、投资人、交易所代表、行业专家等原创深度报道栏目。栏目主要聚焦新一代信息技术领域、生物医药领域、高端装备领域、新材料领域、节能环保领域、新能源领域等六大行业的企业,从创始人、企业、产品、技术、商业模式等角度出发,记录中国科创发展的新范式。