# Yi **Repository Path**: wang_wei_973667927/Yi ## Basic Information - **Project Name**: Yi - **Description**: 零一万物模型 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-04-23 - **Last Updated**: 2024-06-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

English | 中文

打造下一代开源双语大语言模型

🤗 Hugging Face • 🤖 魔搭 ModelScope • ✡️ 始智 WiseModel

👩‍🚀 欢迎来 GitHub Discussions 讨论问题

👋 欢迎加入 👾 Discord 或者 💬 微信群一起交流

📝 欢迎查阅 Yi 技术报告了解更多

📚 欢迎来 Yi 学习中心探索新知

🙌 本文由 Yi 和社区志愿者共同翻译完成，感谢每一位传递知识的火炬手。
🤗 欢迎大家加入「Yi 起翻译」，开启知识之火旅程，共绘技术内容图谱。
📝 本文翻译使用了 Yi-34B-Chat，关于翻译时使用的 prompt 及最佳实践，参阅「如何使用 Prompt 来实现高质量翻译」和「翻译与审校的正确姿势」。

📕 目录

- [📌 Yi 是什么?](#-yi-是什么) - [介绍](#介绍) - [模型](#模型) - [Chat 模型](#chat-模型) - [Base 模型](#base-模型) - [模型信息](#模型信息) - [最新动态](#最新动态) - [📌 如何使用 Yi?](#-如何使用-yi) - [快速上手](#快速上手) - [选择学习路径](#选择学习路径) - [快速上手 - 使用 PyPi (pip install)](#快速上手---pypi-pip-install) - [快速上手 - 使用 Docker](#快速上手---docker) - [快速上手 - 使用 conda-lock](#快速上手---conda-lock) - [快速上手 - 使用 llama.cpp](#快速上手---llamacpp) - [快速上手 - 使用 Web demo](#快速上手---使用-web-demo) - [微调](#微调) - [量化](#量化) - [部署](#部署) - [FAQ](#faq) - [学习中心](#学习中心) - [📌 为什么选择Yi？](#-为什么选择-yi) - [生态](#生态) - [上游](#上游) - [下游](#下游) - [服务](#下游---服务) - [量化](#下游---量化) - [微调](#下游---微调) - [API](#下游---api) - [基准测试](#基准测试) - [Chat 模型性能](#chat-模型性能) - [Base 模型性能](#base-模型性能) - [技术报告](#技术报告) - [引用](#引用) - [📌 谁可以使用 Yi？](#-谁可以使用-yi) - [📌 其它](#-其它) - [致谢](#致谢) - [免责声明](#免责声明) - [许可证](#许可证)

# 📌 Yi 是什么? ## 介绍 - 🤖 Yi 系列模型是 [01.AI](https://01.ai/) 从零训练的下一代开源大语言模型。 - 🙌 Yi 系列模型是一个双语语言模型，在 3T 多语言语料库上训练而成，是全球最强大的大语言模型之一。Yi 系列模型在语言认知、常识推理、阅读理解等方面表现优异。例如， - Yi-34B-Chat 模型在 AlpacaEval Leaderboard [排名第二](https://twitter.com/01AI_Yi/status/1745371506623103087?s=20)，**仅次于 GPT-4 Turbo**，超过了 GPT-4、Mixtral 和 Claude 等大语言模型（数据截止至 2024 年 1 月）。 - Yi-34B 模型在 [Hugging Face Open LLM Leaderboard](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)（预训练）与 C-Eval 基准测试中[荣登榜首](https://mp.weixin.qq.com/s/tLP-fjwYHcXVLqDcrXva2g)，**在中文和英文语言能力方面**均超过了其它开源模型，例如，Falcon-180B、Llama-70B 和 Claude（数据截止至 2023 年 11 月）。 - 🙏 （致谢 Llama ）感谢 Transformer 和 Llama 开源社区，不仅简化了开发者从零开始构建大模型的工作，开发者还可以利用 Llama 生态中现有的工具、库和资源，提高开发效率。

如果你对 Yi 使用 Llama 架构及其许可使用政策感兴趣，参阅「Yi 与 Llama 的关系」。 ⬇️

Model	Intro	默认的上下文窗口	预训练的 tokens 数量	训练数据
6B 系列模型	适合个人和学术使用。	4K	3T	截至 2023 年 6 月。
9B 系列模型	是 Yi 系列模型中代码和数学能力最强的模型。		Yi-9B 是在 Yi-6B 的基础上，使用了 0.8T tokens 进行继续训练。
34B 系列模型	适合个人、学术和商业用途（尤其对中小型企业友好）。 34B 模型尺寸在开源社区属于稀缺的“黄金比例”尺寸，已具大模型涌现能力，适合发挥于多元场景，满足开源社区的刚性需求。		3T

打造下一代开源双语大语言模型

第 0 步：准备工作

第 1 步：启动 Docker

第 2 步：进行推理

使用 Yi Chat 模型进行推理

使用 Yi Base 模型进行推理