基于websocket实现浏览器端文本、视频、语音的即时通讯,以及实时语音转文字
基于websocket实现浏览器端文本、视频、语音的即时通讯,以及实时语音转文字
该项目基于cam++实现的声音分类,能够对输入的音频,自动根据说话人进行分类。
这是基于FunASR实现的区分说话人语音识别API | This is a speaker-diarization-based speech recognition API implemented using FunASR.
这是一个使用Fun-ASR-Nano-2512模型转写的API接口,可私有化部署,无需联网,支持国内外多种语言,中文包括7种方言(吴语、粤语、闽语、客家话、赣语、湘语、晋语)和26种地方口音(河南、山西、湖北、四川、重庆、云南、贵州、广东、广西及其他20多个地区)英文和日文涵盖多种地方口音。此外还支持歌词识别和说唱语音识别。
最近一年贡献:52 次
最长连续贡献:3 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。