首页 / AI办公 / 通义听悟
通义听悟

通义听悟

免费 免费额度 按量付费 多语言 API接入
阿里云计算有限公司

通义听悟是阿里云基于通义千问大模型推出的工作学习AI助手,专注于音视频内容的智能转写、摘要提炼与知识资产管理,将会议、讲座、访谈等内容高效转化为结构化文字成果。

立即访问
评价
浏览
0
收藏
0

通义听悟是阿里云于2023年6月推出的基于大模型的工作学习AI助手,系通义家族首个面向消费级用户的产品。该产品依托通义千问大模型与语音AI技术,可实现音视频内容转写、全文摘要、章节速览及发言总结,支持会议、讲座、培训、访谈、课堂等场景的信息提炼与知识资产沉淀,并与阿里云盘深度打通,支持云盘内音视频分析及字幕匹配。

在技术能力上,通义听悟的核心是高精度语音识别与大语言模型理解的融合。前端采用阿里云前沿语音AI技术,能够将实时音频流或音视频文件中的语音转写成文字,支持中文、英文等多语言,并自动区分发言人。后端依托通义千问大语言模型的强大理解能力,对转写内容进行全文摘要提炼、章节速览和发言总结,自动提取关键词、核心问题和待办事项。

2024年3月,通义听悟重磅升级,音视频问答助手“小悟”正式上线,在业界首次实现单记录、跨记录、多语言自由提问,支持对单个最长6小时、一次性上百条音视频内容的理解问答。用户上传学习资料或会议录像后,可直接向AI提问关键信息,不必完整通读全文。通义听悟已与阿里云盘打通,支持云盘内音视频在线播放时自动匹配字幕,用户可将所有音视频文件存储在云盘中统一管理。

通义听悟的产品形态包括Web端、钉钉小程序等入口,其AI能力也已集成至阿里巴巴内部各类应用,如“钉钉闪记”。个人用户可通过官网免费体验基础功能,企业用户可通过API调用进行二次开发和深度集成。作为通义家族首个面向消费级用户的产品,通义听悟正在将音视频内容从“被动观看”转变为“高效阅读”,帮助用户实现知识资产的数字化沉淀。

AI工具促销

AI工具精选套餐

获取ChatGPT Plus和其他AI工具的组合优惠,享受更多高级功能和服务

了解详情

高精度语音转写与发言人识别

依托阿里云前沿语音AI技术,实现中英文等多语言的高精度实时转写,支持发言人自动区分与分段呈现,准确率行业领先

智能结构化纪要生成

结合通义千问大模型的理解能力,自动生成全文摘要、章节速览、发言总结和关键问题提取,一键输出结构化会议纪要,附待办事项清单

音视频问答助手“小悟”

支持对单个最长6小时、一次性上百条音视频内容进行智能问答,实现单记录、跨记录、多语言自由提问,云端音视频分析实时响应,与阿里云盘深度打通,支持云盘内音视频自动匹配字幕。

AI技能提升课程

学习如何充分利用ChatGPT和其他AI工具,提升工作效率和创造力

立即报名
AI技能课程
1

访问官网

打开https://tingwu.aliyun.com

2

上传/实时录制

上传已有的音视频文件,或通过网页端直接进行实时语音录制

3

AI自动处理

系统自动完成语音转写、发言人识别、智能摘要生成

4

导出与沉淀

导出结构化的纪要内容,或将分析结果同步至阿里云盘沉淀为知识资产。

分享你的使用体验,帮助更多人选择合适的 AI 工具

AI API服务

AI API服务

获取ChatGPT API接入服务,为您的应用添加强大的AI功能

了解详情