行业动态

当前位置:官网首页 > 新闻资讯 > 行业动态 >

干货满满!2019百度AI十大技术创新,每一个都振奋人心

作者: 时间:2019-12-17 来源:
摘要:自然言语处理关乎智能体怎么了解人类的言语与文字、并在了解的基础上进行人机智能交互,被称为“人工智能皇冠上的明珠”,其重要性清楚明了。本年,在自然言语处理技能方面.........

自然言语处理关乎智能体怎么了解人类的言语与文字、并在了解的基础上进行人机智能交互,被称为“人工智能皇冠上的明珠”,其重要性清楚明了。本年,在自然言语处理技能方面,百度打造了可继续学习的常识增强语义了解结构 ERNIE,经过建模海量数据中的实体概念等先验常识,学习实在世界的语义联系。

这种交融常识的语义建模大幅增强了模型的语义表明才能,在合计16个中英文自然言语处理使命上作用逾越了谷歌 BERT 和 XLNet。近来,ERNIE 更是在自然言语处理范畴威望数据集 GLUE 中荣登榜首,并改写该榜单前史,逾越了微软 MT-DNN-SMART, 谷歌 T5、ALBERT 等一众世界尖端预练习模型。

在全球各国探寻 AI 关键技能的道路上,百度 ERNIE 代表我国 AI 科技占有了无足轻重的一席之地。

语音辨认方面,百度提出流式多级的切断注意力模型 SMLTA,这是世界上初次完成部分注意力建模逾越整句的注意力模型,也是世界上初次完成在线语音大规模运用注意力模型。

SMLTA 在大幅提高辨认速度的一起,也提高了辨认精确率。在输入法有用产品相对精确率提高15%,音箱有用产品相对精确率提高20%。

凭借 SMLTA,百度输入法完成了业界普遍认为较难完成的中英文混说辨认,在彻底不影响中文语音输入精确率的情况下,能进行高精准的中英文混合语音识输入。除此之外,方言与方言、方言与普通话的混合语音输入也彻底不在话下。

你或许现已习惯了“前方路口左转”这样的地图语音由一个规范的女声宣布,但是百度地图推出的“语音定制”功用,则能够让你用自己的声响、或者是自己想要的其他人的声响来帮你指挥方向。

这背面是百度语音组成技能 Meitron 的劳绩。针对现阶段语音组成方面面对的风格搬迁、音色模仿和情感拟人三大应战,百度的语音组成技能 Meitron ,能够把声响中的音色、风格、情感等不同元素解耦别离,独立组合,灵敏操控组成的声响,只需录制20句话,就能够制造一个人的专属声响。

根据此技能,百度上线了全球首个地图语音定制功用,为用户带来了史无前例的个性化体会。

翻译为人类从头树立交流的巴别塔,机器翻译则让无障碍交流的门槛降得更低。在机器同传范畴,百度归纳联合词向量解码、语篇翻译模型等新技能,完成高精确、低时延的机器同传,并发布了语音到语音的机器同传体系:DuTongChuan,以及全球首个中文-英文讲演场景语音翻译数据集。

经过实在测验,机器同传作用比美人类舌人。能够说,随时随地自在交流的愿望离咱们越来越近。

在本年的“Baidu Create 2019”百度 AI 开发者大会上,百度 CTO 王海峰为我们展现了一段根据常识图谱了解音乐纪录片《大河唱》的内容。影片中的人物、人物联系、音乐种类、取景地、影片主题等信息,都得到了精准解析,在屏幕上逐个呈现给观众。

这是交融了百度常识图谱技能的视频语义了解才能,经过结合视觉、语音和自然言语处理技能解析多模态信息,并与常识图谱的相关实体树立相关,经过核算和推理,得到电影内容的结构化语义表明,然后了解电影中呈现的人物、音乐和民间艺术等。

还在由于记不住某部电影里纷繁复杂的的人物联系而头疼?有常识的 AI 来帮你整理整理呗。该技能现在已在百度视频查找、引荐、内容生成等多个产品上线。

百度的实时组成虚拟形象技能,结合多模态嘴型生成、GAN、TTS 等技能,完成了业界首个能够量产视频的真人形象虚拟主播,一起具有自动化、渠道化、实时核算、大规模使用和作用传神等技能特色,能够处理以往虚拟主播形象僵硬、响应速度滞后、播报内容刻板等问题。

该技能现已成功使用于多个场景。例如,央视与百度协作打造 AI 虚拟掌管人小灵,露脸央视2019五四晚会;汹涌新闻与百度协作打造了第一个真人形象的虚拟主播迟早新闻栏目;浦发银行与百度协作打造了业界首个“金融数字人”,有颜值、有情感、还有专业的银行常识,将晋级银行客服体会。

AI 的发展需要算力的支撑,当下 AI 范畴精彩纷呈,算力的需求更是大规模上涨。而在算力层面,芯片始终是遭到重视的焦点。特别是在我国,开发者和企业能否用上自主可控的芯片,又让这一重视多了一层含义。

本年,百度发布了专为远场语音交互打造的百度鸿鹄芯片,其规划革新了传统芯片规划办法,遵从“软件界说芯片”的全新规划思路。一起,它选用双核 HiFi4架构,40nm 工艺,2.8M 大内存,在此硬件标准上,只是100mW 左右均匀作业功耗,即可支撑远场语音交互中心的阵列信号处理和语音唤醒才能,将为车载语音交互、智能家居等场景带来更大想象力。

而在12月,根据百度自主研制的 AI 加快芯片-KUNLUN1的百度昆仑云服务器也正式在百度智能云上线。百度昆仑云服务器与百度自主研制的工业级深度学习开源渠道飞桨深度适配,支撑常识增强语义了解结构 ERNIE 等彻底自主可控的抢先算法模型,让我国最好的 AI 跑在我国自己自主可控的芯片之上。

作为车辆与周围环境交互的枢纽,感知体系是完成自动驾驶的关键环节,可谓是自动驾驶体系的一双“眼睛”。在本年的 CVPR 2019举行期间,百度公开了国内仅有的 L4级自动驾驶纯视觉城市道路闭环处理计划——百度 Apollo Lite。

比较旋转式激光雷达感知计划,视觉感知计划价格低且便于取得,为企业、开发者们供给了一个贱价、优质的自动驾驶处理计划。

联系我们
联系我们

电话:

QQ:

邮箱:

地址:

[向上] 
在线客服
咨询电话:
二维码

关注微信