首页 ›资讯› 数码 › 查看内容

微软释出语音、影片辨识API及测试版客制化听写开发工具

2015-12-23 08:48 1754 0

摘要: 微软释出语音及影片辨识API公开测试版，另外，以限定预览版形式释出具备Cortana听写（speech-to-text）能力的客制化工具CRIS（Custom Recognition Intelligence Service）给开发人员。三项技术都是微软人工智慧专案P ...

关键词： 微软影片语音开发人员使用者 API 特定验证 Project

微软释出语音及影片辨识API公开测试版，另外，以限定预览版形式释出具备Cortana听写（speech-to-text）能力的客制化工具CRIS（Custom Recognition Intelligence Service）给开发人员。

三项技术都是微软人工智慧专案Project Oxford的一环。微软指出，影片API让开发人员利用微软影片处理演算法来分析及自动化影片编辑，它可侦测及追踪影片中的脸孔、或是影片中静态背景下的动作，还能确保影片播放的流畅及稳定性。

语音辨识API的用途则是在现有验证工具之外，以使用者声音提供多一层安全验证。语音辨识API也可用在客服上，可由系统自动拨话给客户执行问答验证身份，过程中无需客服专员。

CRIS可将微软语音辨识引擎，针对特定语言字汇、特定环境或特定使用族群客制化开发，并整合于其应用程式中。微软举例，企业开发人员可用它来开发适合嘈杂的工作现场或大卖场的语音辨识应用，或是提供给非母语人士或讲话有障碍的使用者。

有兴趣的使用者可以在Project Oxford 下载影片及语音辨识API。目前CRIS仅释出限定测试版，但开发人员可以申请加入测试。

上个月，微软也释出Project Oxford的影片人物脸部追踪及情绪辨识API。

声明：文章版权归原作者所有部分文章转自互联网如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

收藏分享邀请

上一篇：苹果为什么只在中国生产iPhone？下一篇：英国政府释出间谍软体，引爆骇客社群论战

相关分类

72小时资讯榜

放一晚上就能拿到 exploit！Anthropic 安全

一句话指挥AI黑掉你的网络！这款GitHub 4k

渗透测试

296人已阅读

里程碑：Windows加入原生Linux命令！是否可

业界

1598人已阅读

AI刺激网络安全需求增长，多家网安巨头业绩

网安动态

321人已阅读

高危 HTTP/2 炸弹漏洞突袭！5大主流服务器

网安动态

415人已阅读

英伟达联合微软发布128GB统一内存的NVIDIA

AI动态

416人已阅读

社区热门

━※☆※━★===二〇二六年论坛每日签到帖=

社区活动

2026-03-13

为什么没有新贴了？

编程开发

2025-09-24

从上大学一直玩黑基到现在已经37岁感谢黑

数字空间

2025-06-03

想念各位啊·

数字空间

2025-07-06

好久没来这里了，居然能正常登录，佩服站长

区块技术

2025-05-19

好多年没来竟然还可以登录

区块技术

2025-09-22

微软释出语音、影片辨识API及测试版客制化听写开发工具

最新评论

相关分类