PT-ALIGN:LLM 双安全自对齐开源方案,通过精修正负样本 + 话题引导红队策略,仅需少量人工标注即可实现模型安全对齐。 🔔 项目归属声明:本项目由许晶鑫独立开发,仅由 @MerrySunlight 协助在 Gitee 上进行开源托管。
最近一年贡献:8 次
最长连续贡献:1 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。