sieding

@sieding

sieding 暂无简介

所有 个人的 我参与的
Forks 暂停/关闭的

    sieding/rife-ncnn-vulkan

    sieding/IFRNet-2

    sieding/GFPGAN

    GFPGAN 本质是 "人脸超分+细节重建",非降噪模型。对非人脸噪声(如视频压缩块效应)效果有限。

    sieding/Restormer

    Restormer:高效变压器,用于高分辨率图像修复。用于运动消模糊、图像去泪、去噪(高斯/真实数据)和去焦去模糊。

    sieding/SCUNet

    通过Swin-Conv-UNet和数据综合实现的实用盲图像去噪。用于真实图像去噪的新数据综合工作流

    sieding/BasicSR

    sieding/Real-ESRGAN

    github搬运工,不错的图片超分模型

    sieding/transformers

    sieding/OpenOCR

    sieding/DiffSynth-Studio

    为方便访问引入,来源:https://github.com/modelscope/DiffSynth-Studio.git 与 ModelScope 深度集成,模型可直接从 ModelScope 或 Hugging Face 下载。

    sieding/DiffSynth-Engine

    来源:https://github.com/modelscope/DiffSynth-Engine 方便访问

    sieding/espeak-ng

    eSpeak NG 基于 eSpeak 引擎,由乔纳森·达丁顿 (Jonathan Duddington)创建,使用“共振峰合成”方法,开源软件文本转语音合成器,用于 Linux、Windows、Android 等作系统。它支持 100 多种语言和口音。 来源:https://github.com/espeak-ng/espeak-ng

    sieding/TTS

    Coqui TTS(原 Mozilla TTS),是一个用于高级文本转语音生成的库。 来源:https://github.com/coqui-ai/TTS/

    sieding/piper1-gpl

    Rhasspy Piper是一个开源的语音合成工具,由Rhasspy团队开发,旨在为用户提供自然流畅的语音合成服务。它支持多种语言和语音模型,并允许用户根据自己的需求进行定制和扩展。 来源:https://github.com/OHF-Voice/piper1-gpl(原https://github.com/rhasspy/piper的新址)

    sieding/piper

    Rhasspy Piper是一个由Rhasspy团队开发的开源的语音合成工具,旨在为用户提供自然流畅的语音合成服务。它支持多种语言和语音模型,并允许用户根据自己的需求进行定制和扩展。 来源:https://github.com/rhasspy/piper

    sieding/OpenVoice

    由清华与麻省理工(MIT)的研究者共同开发的开源的即时语音克隆模型。来自https://github.com/myshell-ai/OpenVoice

    sieding/MeloTTS-ONNX

    MeloTTS的ONNX实现,个人认为是目前资源占用、功能、音色结合最好的项目。 来源:https://github.com/season-studio/MeloTTS-ONNX

    sieding/MeloTTS

    轻量快速开源TTS,by: https://github.com/myshell-ai/MeloTTS

    sieding/ChatTTS-ui

    ChartTTS官方推出的本地部署webui,提供API访问

    sieding/ChatTTS

    ChatTTS 是一个 专为对话场景优化的开源 TTS 模型,中文自然度极高,支持多音色(通过 seed 控制),轻量、可本地运行(CPU/GPU 均可)。 来源:https://github.com/2noise/ChatTTS

搜索帮助