本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法。
本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法。
基于aspose的解析pdf文档中所有表格(异构数据)映射结构化对象的工具,由gitee维护
微调 Whisper 语音识别模型,支持无时间戳数据的训练、使用时间戳数据的训练以及无语音数据的训练。加速推理并支持 Web 部署、Windows 桌面部署和 Android 部署
funasr-finetune训练,目前支持paraformer系列模型和nano模型
最近一年贡献:453 次
最长连续贡献:11 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。