您好、欢迎来到现金彩票网!
当前位置:斗牛棋牌下载 > 文语转换 >

百度再推逆天黑科技 长语音文本转化获得重大突破

发布时间:2019-06-04 05:31 来源:未知 编辑:admin

  【慧聪通信网】速记行业正在迎来一场巨大变革,手指翻飞的速记员将与一款网页应用成为“同事”。近日,中国人工智能领导者百度宣布推出SwiftScribe网页应用,将改变完全依赖人工的速记行业现状。该网页应用背靠百度深度语音识别系统,将音频文件转为文本,转化效率较人工速记快1.67倍。

  百度首席科学家吴恩达认为这一应用将改变采访和视频字幕生成,他在Facebook评论称:“该应用非常适合将长语音转换为文本的人士,人工智能将实现1+1大于二的效果。”

  用户可在PC端打开SwiftScribe网页应用,选取wav和mp3格式的文件上传,系统就能马上进行处理,时长1分钟的音频文件可以在30秒内转换完成。用户可使用键盘快捷键就能进行加快播放、后退和添加换行符等操作,处理完成后,只需人工调整大小写、标点及部分拼写细节即可快捷、准确的完成音频转换。

  从使用效果看,SwiftScribe可为速记员带来1.67倍的效率提升,缩短40%的工作时间。目前该系统可处理1小时内的音频文件,而这一时长正在开发团队的努力下逐步延展,未来会增加视频文件的语音识别及自动添加标点符号等功能,并支持更多文件格式,降低用户使用门槛。

  此次推出的SwiftScribe网页应用,依托于百度新一代深度语音识别系统DeepSpeech2——曾被《麻省理工科技评论》评为“2016年十大突破技术”之一。通过利用长达数千小时的语音数据训练,DeepSpeech2可以不断“学习”从语音中识别特定的字或词。MIT评论其:在识别汉语语音片段方面,要比人为识别更加准确。目前,百度语音识别准确率已达到97%,成为行业领先者。

  作为非英语母语者,百度SwiftScribe项目经理吴田也曾深受长语音记录的困扰“要整理一段1小时录音对我来说要花上10个小时,”而这也是这一应用的灵感来源。百度在去年也推出了应用Deep Speech 2的安卓输入法TalkType,让用户能够用语音快速输入文字。百度硅谷人工智能实验室项目领导人BijitHalder在公告中称:“TalkType是首款智能语音优先输入法。”

  对线人工智能的发展风口,百度吴恩达曾在《华尔街日报》的采访中表示,随着准确率的提高和用户体验的提升,百度的语音产品已度过用户心目中的“试用期”。在语音产品迅猛发展的大环境下,亚马逊、苹果、谷歌和微软等科技巨头都在加紧研发各自的语音识别技术,然而在长文本音频转化技术上,百度仍然是行业最高水平的标杆。

  目前,百度SwiftScribe音频转换服务免费对外开放,但该应用背后的商业前景不可小觑。据百度人士透露,未来希望能够向商业化应用转变。

http://sennenresources.com/wenyuzhuanhuan/79.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有