Name: 讯飞听见
Author: 讯飞听见

产品演进

持续迭代 · 不断进化

讯飞听见自2015年发布以来，已完成超过60个版本迭代，每一次升级都凝聚百万用户反馈与技术突破。

2015 · 起步

首个版本发布，集成基础语音识别引擎，准确率达85%，开启中文语音转写产品化先河，被广泛应用于记者采访与学术讲座场景。

2018 · 突破

深度学习模型上线，准确率突破95%，引入说话人分离技术与多人会议场景支持，开启企业级商用时代，签约首批500强客户。

2021 · 生态

开放API与SDK，与钉钉、企业微信、飞书等办公平台深度集成，推出行业定制方案，进入金融、教育、医疗等垂直领域头部市场。

2024 · 智能

大模型技术深度融合，自动生成会议纪要、智能问答、内容摘要，实现从"转写工具"到"AI助理"的全面进化。

2026 · 引领

支持50余种语言实时互译，多模态理解能力上线，结合情感分析与意图识别，构建智能办公全新生态，用户突破5000万。

未来 · 探索

持续投入AGI语音交互研发，探索更自然的人机对话、更精准的多模态理解，让语音成为下一代计算的核心入口。

常见问题

使用中的常见疑问

以下整理了用户最关心的问题，如有其他疑问欢迎随时联系。

讯飞听见收费吗？免费版有哪些限制？付费升级值不值？

讯飞听见提供永久免费版本，不设强制付费门槛，新用户注册即享每月60分钟实时转写额度，可满足个人日常轻度使用需求。免费版包含：实时语音转写（限中文普通话）、单文件音频转写（最长60分钟/文件）、TXT纯文本导出、历史记录保留30天。对于有更高需求的用户，专业版（299元/年）非常值得升级：每年2000分钟转写时长（约为免费版的33倍）、覆盖50余种语言实时翻译、导出格式扩展至Word/PDF/SRT/ASS/VTT/Markdown等十余种、5GB云端存储空间、20人在线协作编辑、专属客服支持。相比免费版，专业版将月度处理能力从1小时提升至160余小时，大幅拓展使用边界，是内容创作者、商务人士和研究人员的首选方案。

录音文件格式有什么要求？最长支持多长的音频？

讯飞听见支持导入的音频格式包括：MP3、WAV、M4A、AAC、OGG、FLAC、AMR、WMA、PCM等十余种主流格式，几乎覆盖日常使用的所有音频类型。单个文件最大支持4小时时长、2GB大小，超出此限制的音频建议使用音频编辑软件（如Audacity）进行分段切割后再导入转写。视频文件（MP4、AVI、MOV、MKV）的音轨也可直接拖入讯飞听见，系统自动分离音视频，仅对音频部分进行转写。录制建议：采样率不低于16kHz（推荐44.1kHz/48kHz）、比特率不低于64kbps（推荐128kbps以上）、声道建议单声道或双声道混音，环境背景噪音控制在40分贝以下（相当于安静图书馆的噪音水平），满足以上条件的音频可获得最佳识别效果。

如何全面保障录音内容的隐私与数据安全？

讯飞听见构建了七层数据安全体系，确保用户隐私滴水不漏：第一层——传输安全，所有上传下载均采用TLS 1.3加密通道，防止网络窃听；第二层——存储安全，音频与文本数据在云端采用AES-256静态加密存储，即使服务器被物理访问也无法解析内容；第三层——权限管控，基于RBAC模型的细粒度权限体系，确保数据仅授权人员可访问；第四层——合规认证，通过国家信息安全等级保护三级认证、ISO 27001信息安全管理体系认证、ISO 27701隐私信息管理体系认证、SOC 2 Type II审计；第五层——数据隔离，多租户架构确保不同用户数据完全逻辑隔离；第六层——自动清零，转写完成后7天自动从生产环境清除音频缓存（文本留存由用户决定）；第七层——用户主权，用户可随时一键彻底删除全部历史数据，删除后数据无法恢复，完全符合GDPR与中国《个人信息保护法》要求。

讯飞听见支持识别哪些方言与小语种？口音适配效果如何？

讯飞听见在语言覆盖上处于业界领先水平。中方语言方面，普通话为默认模式，同时支持粤语、四川话、东北话、上海话、闽南语、客家话、湖南话（长株潭）、河南话、天津话、山东话（济南）、陕西话等20余种主要方言与地方口音，各方言模式需在设置-语言中手动切换（部分方言需专业版以上开通）。外语方面，支持英语（含美式、英式、澳式口音）、日语、韩语、法语、德语、西班牙语、俄语、阿拉伯语、葡萄牙语、意大利语、越南语、泰语、印尼语、马来语、印地语等50余种语言，覆盖全球主要贸易与旅游地区。此外还支持少数民族语言：藏语（卫藏方言）、维吾尔语、蒙古语（内蒙古）等，少数民族语言持续扩展中。针对外籍人士说中文的混合语音，系统会自动识别语种切换并分段标注，无需手动干预。

企业采购有什么优惠方案？定制化服务的完整流程是怎样的？

企业采购实行阶梯折扣政策：10席起购享受95折优惠、50席以上9折、100席以上85折、500席以上75折并可申请定制专属报价，年度续费在原价基础上额外95折。企业定制化服务完整流程分为五个阶段：①需求调研阶段（1-2周）：商务顾问与技术人员联合驻场调研，深入了解业务流程、技术环境、安全要求与预算范围；②方案设计阶段（2-3周）：输出包含功能清单、网络架构、硬件规格、安全方案、培训计划的完整解决方案，并提供2-4周免费POC验证；③合同签订阶段：明确SLA服务等级协议、数据处理协议（DPA）、保密协议（NDA）；④部署实施阶段（2-4周）：由原厂工程师完成软件部署、数据迁移、权限配置与UAT验收；⑤持续运营阶段：季度业务回顾、年度版本升级、7×24小时专属技术支持、紧急问题2小时响应机制。

软件升级是自动还是手动？版本更新频率与内容说明

讯飞听见客户端默认启用智能自动升级检测，每次启动时自动连接更新服务器检测最新版本，发现新版本后弹出升级提示，用户点击"立即更新"即可自动下载安装包并热更新，全程无需手动干预。更新频率与内容分层如下：Bug修复版（每周1-2次）修复崩溃、卡顿、兼容性问题，用户无感知自动静默更新；功能迭代版（每2-4周一次）包含新功能上线、交互体验优化、识别效果小幅提升，更新包约20-50MB；重大版本（每年3-4次，版本号从v4.x到v5.x）带来全新模块、重大算法升级、UI改版，更新包约100-200MB，含完整更新日志说明。所有已付费用户在有效期内均可免费享受所有版本升级。另有Beta测试通道供专业用户提前体验新功能，反馈建议可参与版本共创计划。

转写时电脑需要联网吗？网络带宽要求与流量消耗？

讯飞听见在线转写模式必须在有网络连接的环境下运行，因为实时语音数据需要传输至云端AI服务器进行处理。带宽要求：最低带宽为上行1Mbps（相当于4G移动网络）、推荐上行5Mbps以上（相当于百兆宽带）；实测在10Mbps稳定网络下，1小时实时转写的流量消耗约300-500MB（包含语音数据传输与指令控制开销），月均使用10小时约消耗3-5GB流量，对于家庭宽带和4G/5G网络而言几乎可忽略不计。延迟方面：端到端延迟（说话到文字显示）约0.8-1.5秒，处于业界领先水平。如需应对无网或弱网场景，专业版用户可在设置中下载离线语言包（约300MB），离线模式下无需任何网络连接即可完成转写，但仅支持普通话、英语、日语、韩语四种语言，准确率略低于在线模式约3-5个百分点。

功能模块	免费版	专业版	企业版
实时语音转写
音频文件转写	每月60分钟	每月2000分钟	不限时长
多语言翻译
字幕生成导出
多人协作
API接口
专属客服

讯飞听见
桌面下载
智能会议记录

全场景覆盖 · 功能丰富

智能语音识别

会议智能管理

实时翻译互译

字幕制作工具

数据安全保障

开放API接入

为什么选择讯飞听见

自研深度学习模型

分布式高可用架构

个性化词库定制

全天候技术支持

各版本功能对比

持续迭代 · 不断进化

2015 · 起步

2018 · 突破

2021 · 生态

2024 · 智能

2026 · 引领

未来 · 探索

使用中的常见疑问

开始使用讯飞听见

Windows 版

macOS 版

移动端 App

讯飞听见桌面下载智能会议记录

全场景覆盖 · 功能丰富

智能语音识别

会议智能管理

实时翻译互译

字幕制作工具

数据安全保障

开放API接入

为什么选择讯飞听见

自研深度学习模型

分布式高可用架构

个性化词库定制

全天候技术支持

各版本功能对比

持续迭代 · 不断进化

2015 · 起步

2018 · 突破

2021 · 生态

2024 · 智能

2026 · 引领

未来 · 探索

使用中的常见疑问

开始使用讯飞听见

Windows 版

macOS 版

移动端 App

讯飞听见
桌面下载
智能会议记录