| 关键词: 微软 影片 语音 开发 人员 使用者 API 特定 验证 Project |
微软释出语音及影片辨识API公开测试版,另外,以限定预览版形式释出具备Cortana听写(speech-to-text)能力的客制化工具CRIS(Custom Recognition Intelligence Service)给开发人员。 三项技术都是微软人工智慧专案Project Oxford的一环。微软指出,影片API让开发人员利用微软影片处理演算法来分析及自动化影片编辑,它可侦测及追踪影片中的脸孔、或是影片中静态背景下的动作,还能确保影片播放的流畅及稳定性。 语音辨识API的用途则是在现有验证工具之外,以使用者声音提供多一层安全验证。语音辨识API也可用在客服上,可由系统自动拨话给客户执行问答验证身份,过程中无需客服专员。 CRIS可将微软语音辨识引擎,针对特定语言字汇、特定环境或特定使用族群客制化开发,并整合于其应用程式中。微软举例,企业开发人员可用它来开发适合嘈杂的工作现场或大卖场的语音辨识应用,或是提供给非母语人士或讲话有障碍的使用者。 有兴趣的使用者可以在Project Oxford 下载影片及语音辨识API。目前CRIS仅释出限定测试版,但开发人员可以申请加入测试。 上个月,微软也释出Project Oxford的影片人物脸部追踪及情绪辨识API。 |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|