当前位置:6374刘伯温开奖结果 > 人工专门知识 >

杜小军:中润普达在人工智能语义识别领域的成果

  新浪财经讯 “2019中国智能产业论坛”于2019年5月30日在北京举行,本次活动为京交会论坛活动之一,主题为:“智能+”引领未来,北京中润普达(集团)有限公司联合创始人、CEO杜小军出席并演讲。

  杜小军曾经接受马来西亚国家工业和信息化部、美国的贝尔实验室以及一带一路的政府和机构的邀请,共同致力于全球中文大数据跨国研究和技术的实践。

  杜小军:非常感谢在这样一个场合和机会,向和大家分享一下我们这个团队在人工智能的语义识别方面近两年一些新的成绩,我记得去年在第二十届深圳高新技术交易会上,我们中润普达在中文语义识别方面正在苦苦的探索,到今天我可以把这两年新的一些成果跟大家作一个分享和汇报。

  我们公司的核心技术是中文语义识别,前面无论是联想还是微软的专家他们聚焦在NRP方面,应该说我们这一个方面也做了一些探索,我们看到认知计算是泛人工智能核心技术之一,在这一领域,如何让机器理解人类语言,至少是可以理解人类的词汇体系?这是我们的一个目标。

  为了实现这一个想法和目标,当前的很多工作尤其是技术研发还是比较困难的。我们近两年投了将近两三个亿的资金,在这方面深度的做一些工作,坦率的讲确实我非常认可包括微软同事说的一样,越往前走感觉难度越大,你比如说语义这里面任何一个问题,我们期望机器人去理解、让机器人去推理归纳,从表面上我们都有可能,我们有很好的技术,有深度学习,有知识图谱,但是要达到这一些可能短期我们也觉得还有一定的距离。但是我们必然往前走,我今天就想重点介绍一下,我们在实现这样一个问题上的路径是什么?

  我们认为认知智能是AI发展的焦点,也是释放AI产能的关键。在这领域我们过去看到计算智能,它里面非常有明确的规则,也适合我们现在的一些特定的领域,也就是当我们数据足够量大的时候,数据规则足够清晰的时候,计算智能应该是发展非常快的,逐步过渡到IOT就是现在感知智能这一块,像语音、图像、视频尤其随着边缘计算和我们计算能力的提升,这一块目前应该是发展非常快的。

  非常值得一提的是,我们选择在认知智能这一个领域,不断的进行突破,可能在理解、推理解释方面,让机器具备人一样的思维能力,这个就是软件,这个里面包括刚才徐总也提到了我们说的人工智能应该像人一样,我们把它加了另外一个词应该说是像人一样去思考,怎么做到这一点呢?我们看到有几个条件来让我们距离这一种可能,第一是海量的数据,为机器学习提供了养料,我们看一下互联网技术让我们衣食住行行业的互联网化、数据化在这过程当中产生的数据是海量,无论是数据是结构化、还是非结构化,但是它必然给我们提供了一个可能,就是这一些数据让获取可能性更大,我们中润普达集团下面投资和控股了4个交易中心,分别是东湖大数据交易中心、钱塘大数据中心、还有江苏省大数据中心、还有国家大数据服务平台。为什么要参与这一些产业的布局呢?核心就是为我们未来得为机器提供足够多的有价值的这种海量的数据,这也是我们在这产业的布局中思考。

  人工智能的产品落地离不开海量数据的养料,贡献于机器过程中不断训练和优化算法模型,我也非常认同包括今天韦博士提到的一样,我们过去太强调算法,所以我们周边的同行坦率地讲大部分都是以算法为主,只有我们默默这几年至少走了将近5年的时间,聚焦在我们的以数据为主、同时这一些数据有很多还是非结构化数据,我们在这领域寂寞了5年,也是在技术方面一直不断的进行积累。应该说是通过这样一些积淀有一些相应的成绩或者是出来一些相关的应用,我等一会给大家作一个简单的汇报。

  这里面海量的数据我们可以看到像大健康行业,这已经是比较客观了。像诊疗服务阶段、还有咨询服务阶段、信息服务阶段这一种大健康行业的数据,现在已经应该说是整个我们智能机器这一块需求非常大的,也是比较直接的。我们看到亿欧智库发布了一个报告2020年人类产生的医疗数据总量达到40万亿的GB,这个数据规模挺大的,但是问题是不是都能被我们的机器识别,是不是都能服务于人工智能智能化的场景应用里面去,这是当前我们碰到的一个核心问题。

  非结构化认知能力赋予我们智能+更多的智能可能。一种说法是比如我们现在基于结构化数据,也就是我们的这种逻辑结构非常清晰的数据,这构建了我们智能+基础的一些应用场景。但是我今天想提的是,基于非结构化数据照样在这领域我们不可能完全脱离掉非结构化数据,必然把结构化数据、非结构化数据融合起来,让我们的机器具备一定的认知计算能力。我们认为认知计算目前有三大商业应用,一个领域是产品的应用将认知计算嵌入到我们的传统产品里面去,比如说爱国者很多产品里面去,来实现智能的行为、自然的交流以及自动化,这也就是我们说的把我们的人工智能和我们的产品结合起来。

  第二个方面流程的应用使用认知计算来实现流程人工智能,也就是ERP等等这一些传统新的硬件的应用,利用我们现在技术的突破更加的优化。还有第三类是分析类应用,用认知计算模式指导更有效的行动,围绕这三个方面我们认为认知计算大有可为。

  我们做的是什么呢?就是让机器人沟通交流的人工智能类脑辅助系统。国外叫NRP这产业链是相对技术比较成熟,但是中国碰到一个问题是我们中国的算法居多,尤其是中文还没有这个领域更多的突破,就像我们应该看到过去中国真正实现了在互联网技术全球的总代,我是从互联网过来,IT领域或者泛IT领域也就是我们现在看到激光照排(音)技术它根本是基于汉字,我们相信中文这一直有一个分支这就是基于中文的语义识别,不是仅仅基于NRP的语义识别。

  我们的具体做法就是具体的场景和目标任务下通过添加分词,分词就含有意群,并植入这类脑计算系统,无需写代码,系统可以帮助网络机器和设备具备自我学习、发现、理解、推理整个的能力,并形成自我的知识体系,这个里面有一点是我们和行业是形成自己的知识图谱,当前我们希望把行业的知识图谱和我们自己构建的这种知识图谱能够结合起来。

  还有一个方面它能让机器人一样实现智能对话、智能客服、智能聊天,句子生成、知识发现、模式识别智能分析等,并按照专署应用场景的知识业务,这是我们开发叫1.0版,这只是初步解决了一些问题,还没有公开公测上线,这过程花费了大量的精力和时间在这领域进行突破。

  围绕这一个领域我们把一些应用和行业结合起来,这就是我们碰到现实的客观问题,紧紧依靠我们这技术它很难走向深入,所以我们就不断的和相关行业结合起来,形成了一些微创新,这一些微创新进一步补充和丰富目前的技术创新。这里面举一个例子,后面有不断的小的场景应用。第一个健康拍征,拍征是成熟的语义识别智能诊断辅助系统,通过海量知识的体系构建形成GB的辅助,做到中医的望闻问切,我们全部是用中文语义识别技术来构建的问诊系统。比如说拍征我们把两三千组GB全部的知识体系重构了一遍,为每一个GB构建了新的纬度,让机器参与深度学习。 比如说图像识别也是一样,通过拍面征手征来帮助我们对疾病进行诊断。

  第三个方面我们做了食品的拍征,将这领域进一步的纵深形成了一个产业,这是我们和中国张志发(音)院士的团队来共同构建,前面是智能诊断,后面是精准的功能性食品的提供,就是把智能技术仅仅作为整个产业链的环节,所以我们目前健康科技专门致力于功能食品,就是为糖尿病,和高血压提供功能性食品,怎么确定你是高血压病人和糖尿病人我们要在随时诊断的过程中提供科学的诊断服务,所以这是我们目前赋能在产业链上的这已经成立公司。 它的背后是呈现了我们智能健康的,就是大数据系统,这里面就不多说了。

  第四个方面是在化验单的拍征方面,就是病历结构主要应用于中文语义识别处理技术,语义识别技术病历结构化相关应用挖掘数据深层的价值。我们目前很多拿到化验单以后都是在椅子排队等着医生看到底什么问题,其实很多过程中,我们把这样一个化验单拍完以后我们马上可以实现像医生一样对你验尿,我们叫OCI全部分析形成一个疾病报告。

  像汽车拍征也是利用我们这一些人工智能的技术把各种症状和征兆,这后面大量新的汽车知识体系的构建,我们现在汽车知识体系几乎用不上这投入也是巨大。比如说车征宝,3分钟让你成为一个专家,也就是汽车诊断的辅助系统。还有作物拍征,我们是为每一个农作物拍一个照片,我们告诉你作物害了什么病,下面有一个农业科技的人助手,也是我们行业和实体经济密切结合起来。还有菜品拍征,我们把每一次营养、健康等等和日常生活密切结合起来。

  我们把魔系和拍征结合起来把语义识别、语音识别、图像识别结合起来,为每一个终端装上专属场景的有知识会聊天的能决策、能自主学习的并且有性格、有性感的中文语言交流沟通的大脑也就是类大脑系统,当然现在不是叫大脑是叫类大脑。目前这研发应该说是已经在这一条路上很坚定的往前走,逐步会有一些具体的应用在行业当中展开。当然这过程当中也希望得到各位的支持和帮助。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

http://antalyaesc.com/rengongzhuanmenzhishi/159.html
点击次数:??更新时间2019-06-03??【打印此页】??【关闭
  • Copyright © 2002-2017 DEDECMS. 织梦科技 版权所有  
  • 点击这里给我发消息
在线交流 
客服咨询
【我们的专业】
【效果的保证】
【百度百科】
【因为有我】
【所以精彩】