SenseVoice-Small 语音识别模型

SenseVoice 是具有音频理解能力的音频基础模型,包括语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。

支持 MP3, WAV, FLAC, M4A 等常见音频格式。

upload_file 上传音频
文件大小上限为 100 MB

或拖拽文件至此页面

自动检测
中文
English
粤语
日本語
한국어
无语音
高级设置

play_arrow 开始识别

松开即可上传文件