智能转写
会议记录
字幕生成
多语言翻译
云端同步
AI赋能 · 智能会议

讯飞听见
桌面下载
智能会议记录

讯飞听见中文版专为中文用户打造,智能会议记录与语音转写服务,操作简便、界面友好,助力企业办公效率全面提升。

免费试用 隐私保护 多端同步

全场景覆盖 · 功能丰富

讯飞听见配备完善的语音转写功能生态,满足从个人记录到企业级应用的各类需求。

智能语音识别

深度学习驱动的语音识别引擎,支持普通话、粤语及多方言,识别准确率行业领先。

会议智能管理

自动识别说话人角色,生成结构化会议纪要,支持议程标注与关键事项高亮。

实时翻译互译

支持中文与英日韩等语种实时互译,跨国会议无障碍沟通,翻译自然流畅。

字幕制作工具

一键生成精准字幕,兼容各类视频格式,支持时间轴调整与样式自定义。

数据安全保障

端到端加密传输与存储,通过等保三级认证,企业数据安全无忧。

开放API接入

提供标准RESTful API接口,支持与企业OA、IM系统无缝集成与二次开发。

0万+ 企业用户
0% 识别准确率
0+ 支持语种
0万+ 会议场景

为什么选择讯飞听见

依托科大讯飞深厚技术积累,为用户提供稳定、可靠、高效的智能语音服务。

自研深度学习模型

讯飞听见采用科大讯飞自研的新一代语音识别深度学习模型,持续迭代优化,识别效果业内领先。

分布式高可用架构

基于云原生架构设计,支持弹性扩容,保障高峰期稳定服务,多可用区冗余部署。

个性化词库定制

支持上传专业术语词典,自定义识别规则,金融、医疗、法律等行业词汇精准识别。

全天候技术支持

7×24小时专业技术支持,配备专属客服团队,提供培训与定制化解决方案。

各版本功能对比

选择最适合您的版本,开启高效智能转写体验。

功能模块免费版专业版企业版
实时语音转写
音频文件转写每月60分钟每月2000分钟不限时长
多语言翻译
字幕生成导出
多人协作
API接口
专属客服

持续迭代 · 不断进化

讯飞听见自2015年发布以来,已完成超过60个版本迭代,每一次升级都凝聚百万用户反馈与技术突破。

2015 · 起步

首个版本发布,集成基础语音识别引擎,准确率达85%,开启中文语音转写产品化先河,被广泛应用于记者采访与学术讲座场景。

2018 · 突破

深度学习模型上线,准确率突破95%,引入说话人分离技术与多人会议场景支持,开启企业级商用时代,签约首批500强客户。

2021 · 生态

开放API与SDK,与钉钉、企业微信、飞书等办公平台深度集成,推出行业定制方案,进入金融、教育、医疗等垂直领域头部市场。

2024 · 智能

大模型技术深度融合,自动生成会议纪要、智能问答、内容摘要,实现从"转写工具"到"AI助理"的全面进化。

2026 · 引领

支持50余种语言实时互译,多模态理解能力上线,结合情感分析与意图识别,构建智能办公全新生态,用户突破5000万。

未来 · 探索

持续投入AGI语音交互研发,探索更自然的人机对话、更精准的多模态理解,让语音成为下一代计算的核心入口。

使用中的常见疑问

以下整理了用户最关心的问题,如有其他疑问欢迎随时联系。

讯飞听见提供永久免费版本,不设强制付费门槛,新用户注册即享每月60分钟实时转写额度,可满足个人日常轻度使用需求。免费版包含:实时语音转写(限中文普通话)、单文件音频转写(最长60分钟/文件)、TXT纯文本导出、历史记录保留30天。对于有更高需求的用户,专业版(299元/年)非常值得升级:每年2000分钟转写时长(约为免费版的33倍)、覆盖50余种语言实时翻译、导出格式扩展至Word/PDF/SRT/ASS/VTT/Markdown等十余种、5GB云端存储空间、20人在线协作编辑、专属客服支持。相比免费版,专业版将月度处理能力从1小时提升至160余小时,大幅拓展使用边界,是内容创作者、商务人士和研究人员的首选方案。
讯飞听见支持导入的音频格式包括:MP3、WAV、M4A、AAC、OGG、FLAC、AMR、WMA、PCM等十余种主流格式,几乎覆盖日常使用的所有音频类型。单个文件最大支持4小时时长、2GB大小,超出此限制的音频建议使用音频编辑软件(如Audacity)进行分段切割后再导入转写。视频文件(MP4、AVI、MOV、MKV)的音轨也可直接拖入讯飞听见,系统自动分离音视频,仅对音频部分进行转写。录制建议:采样率不低于16kHz(推荐44.1kHz/48kHz)、比特率不低于64kbps(推荐128kbps以上)、声道建议单声道或双声道混音,环境背景噪音控制在40分贝以下(相当于安静图书馆的噪音水平),满足以上条件的音频可获得最佳识别效果。
讯飞听见构建了七层数据安全体系,确保用户隐私滴水不漏:第一层——传输安全,所有上传下载均采用TLS 1.3加密通道,防止网络窃听;第二层——存储安全,音频与文本数据在云端采用AES-256静态加密存储,即使服务器被物理访问也无法解析内容;第三层——权限管控,基于RBAC模型的细粒度权限体系,确保数据仅授权人员可访问;第四层——合规认证,通过国家信息安全等级保护三级认证、ISO 27001信息安全管理体系认证、ISO 27701隐私信息管理体系认证、SOC 2 Type II审计;第五层——数据隔离,多租户架构确保不同用户数据完全逻辑隔离;第六层——自动清零,转写完成后7天自动从生产环境清除音频缓存(文本留存由用户决定);第七层——用户主权,用户可随时一键彻底删除全部历史数据,删除后数据无法恢复,完全符合GDPR与中国《个人信息保护法》要求。
讯飞听见在语言覆盖上处于业界领先水平。中方语言方面,普通话为默认模式,同时支持粤语、四川话、东北话、上海话、闽南语、客家话、湖南话(长株潭)、河南话、天津话、山东话(济南)、陕西话等20余种主要方言与地方口音,各方言模式需在设置-语言中手动切换(部分方言需专业版以上开通)。外语方面,支持英语(含美式、英式、澳式口音)、日语、韩语、法语、德语、西班牙语、俄语、阿拉伯语、葡萄牙语、意大利语、越南语、泰语、印尼语、马来语、印地语等50余种语言,覆盖全球主要贸易与旅游地区。此外还支持少数民族语言:藏语(卫藏方言)、维吾尔语、蒙古语(内蒙古)等,少数民族语言持续扩展中。针对外籍人士说中文的混合语音,系统会自动识别语种切换并分段标注,无需手动干预。
企业采购实行阶梯折扣政策:10席起购享受95折优惠、50席以上9折、100席以上85折、500席以上75折并可申请定制专属报价,年度续费在原价基础上额外95折。企业定制化服务完整流程分为五个阶段:①需求调研阶段(1-2周):商务顾问与技术人员联合驻场调研,深入了解业务流程、技术环境、安全要求与预算范围;②方案设计阶段(2-3周):输出包含功能清单、网络架构、硬件规格、安全方案、培训计划的完整解决方案,并提供2-4周免费POC验证;③合同签订阶段:明确SLA服务等级协议、数据处理协议(DPA)、保密协议(NDA);④部署实施阶段(2-4周):由原厂工程师完成软件部署、数据迁移、权限配置与UAT验收;⑤持续运营阶段:季度业务回顾、年度版本升级、7×24小时专属技术支持、紧急问题2小时响应机制。
讯飞听见客户端默认启用智能自动升级检测,每次启动时自动连接更新服务器检测最新版本,发现新版本后弹出升级提示,用户点击"立即更新"即可自动下载安装包并热更新,全程无需手动干预。更新频率与内容分层如下:Bug修复版(每周1-2次)修复崩溃、卡顿、兼容性问题,用户无感知自动静默更新;功能迭代版(每2-4周一次)包含新功能上线、交互体验优化、识别效果小幅提升,更新包约20-50MB;重大版本(每年3-4次,版本号从v4.x到v5.x)带来全新模块、重大算法升级、UI改版,更新包约100-200MB,含完整更新日志说明。所有已付费用户在有效期内均可免费享受所有版本升级。另有Beta测试通道供专业用户提前体验新功能,反馈建议可参与版本共创计划。
讯飞听见在线转写模式必须在有网络连接的环境下运行,因为实时语音数据需要传输至云端AI服务器进行处理。带宽要求:最低带宽为上行1Mbps(相当于4G移动网络)、推荐上行5Mbps以上(相当于百兆宽带);实测在10Mbps稳定网络下,1小时实时转写的流量消耗约300-500MB(包含语音数据传输与指令控制开销),月均使用10小时约消耗3-5GB流量,对于家庭宽带和4G/5G网络而言几乎可忽略不计。延迟方面:端到端延迟(说话到文字显示)约0.8-1.5秒,处于业界领先水平。如需应对无网或弱网场景,专业版用户可在设置中下载离线语言包(约300MB),离线模式下无需任何网络连接即可完成转写,但仅支持普通话、英语、日语、韩语四种语言,准确率略低于在线模式约3-5个百分点。

开始使用讯飞听见

支持Windows、macOS及移动端,满足您的全场景使用需求。

Windows 版

支持 Win 7 及以上系统

v4.2.1

macOS 版

支持 macOS 10.14 及以上

v4.1.8

移动端 App

iOS & Android 双平台

v3.9.5
立即下载讯飞听见