# 知识库管理

**Repository Path**: coco_lele/knowledge-base-management

## Basic Information

- **Project Name**: 知识库管理
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 0
- **Created**: 2025-02-25
- **Last Updated**: 2025-02-25

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# RAG Application with Java Ecosystem

![Java](https://img.shields.io/badge/Java-11+-orange)
![Spring Boot](https://img.shields.io/badge/Spring_Boot-2.4.3-brightgreen)
![LangChain4j](https://img.shields.io/badge/LangChain4j-0.28-blue)

### 在线体验
> 请善待公共服务，会不定时停用

地址：[http://113.207.105.162:9099/](http://113.207.105.162:9099/)
密码：test/123456

## 介绍
本项目是一个基于Java语言开发的 **RAG (Retrieval-Augmented Generation)** 应用，利用多种开源技术构建智能对话系统，支持从大量知识库中检索信息，并将这些信息与生成的自然语言结合，提供高质量的答案。该应用基于 **Spring Boot**、**MyBatis**、**Elasticsearch**、**Redis**、**LangChain4J** 和 **通义千问大模型**，实现了高效的对话存储、检索和自然语言生成。


## 📚 什么是RAG？

**RAG (Retrieval-Augmented Generation)** 是一种增强生成的检索式生成技术，它结合了信息检索与自然语言生成两种技术。RAG 系统的核心在于：

1. **检索（Retrieval）**：首先，从外部知识库（如数据库、搜索引擎等）中检索相关信息。
2. **生成（Generation）**：然后，基于检索到的信息，生成一段自然语言答案或文本。

**RAG (Retrieval-Augmented Generation)**与传统的生成模型相比有以下优势。
- **知识幻觉问题**：基于可信数据源生成内容
- **数据实时性不足**：动态更新检索知识库
- **领域适配困难**：快速对接业务专属知识
- **可解释性增强**：提供生成结果的参考依据

## 🚀 核心功能

- 基于自然语言的智能问答系统
- 多源异构数据接入支持
- 实时上下文感知对话
- 外部API服务动态调用（Function Calling）
- 对话历史缓存与追溯
- 回答可信度验证支持

## 🛠️ 技术栈

| 组件             | 用途                          | 版本    |
|------------------|-----------------------------|--------|
| Spring Boot      | 提供了构建应用的基础框架，简化了应用的配置与部署过程。                      | 3.1.5  |
| LangChain4j      | 一个用于构建RAG应用的框架，帮助整合信息检索和自然语言生成，提供了一些通用的API和工具，使得系统能够无缝连接各个组件。                 | 0.23   |
| 通义千问         | 作为自然语言生成的基础，使用大规模预训练的生成模型进行文本生成，确保生成的答案具有高质量和语言自然性。                     | QWEN-72B |
| Elasticsearch    | 作为向量存储和搜索引擎，用于检索与查询相关的文档或信息。它支持高效的全文搜索和向量搜索。                   | 8.11   |
| Redis            | 作为会话存储系统，缓存对话状态，保证系统的响应速度和状态一致性。               | 7.2    |
| MyBatis          | 作为数据访问框架，用于从数据库中读取和写入数据，支持与Elasticsearch和Redis的交互。                     | 3.5.11 |


## 关键技术原理
![RAG 核心工作流程图](./rag.png)

### 1. 信息检索与向量搜索

在本应用中，**Elasticsearch** 扮演着信息检索的角色。通过向量化技术，用户输入的查询文本会被转化为向量表示，然后在 **Elasticsearch** 的向量索引中进行匹配，找到最相关的文档。这里使用的向量搜索技术大大提高了检索的精确度和速度。

- **向量化**：查询文本通过嵌入模型（如BERT、GPT等）转化为向量，这些向量用于表示文本的语义信息。
- **向量索引**：通过 Elasticsearch 构建向量索引，使得检索过程可以在高维向量空间中找到相似文本。
- **相似性计算**：利用余弦相似度、欧式距离等算法来衡量查询向量与文档向量的相似度，从而找到最相关的内容。

### 2. 自然语言生成

生成部分采用了 **通义千问大模型**，这是一种基于预训练大规模语言模型的生成技术。它通过对大规模文本数据的训练，能够生成具有逻辑性和流畅性的自然语言文本。

- **输入处理**：通过结合检索到的信息和用户的查询，形成一个富含上下文信息的提示（prompt）。
- **文本生成**：通义千问大模型基于这个提示生成准确且相关的回答。生成的文本不仅包含检索到的事实信息，还能根据上下文进行适当的语言表达。

### 3. 会话存储与状态管理

为了实现跨会话对话和个性化定制，本应用使用 **Redis** 存储对话状态。每个用户的对话历史被缓存于Redis中，保证了系统对用户上下文的追踪。

- **会话存储**：所有的用户输入和模型的响应都被存储在Redis中，能够随时恢复对话状态。
- **对话历史管理**：通过管理对话历史，系统能够记住用户的偏好和先前的交互信息，从而生成更加贴合的回答。

### 4. 动态函数调用

通过 **FunctionCall** 功能，应用能够调用外部的API或自定义函数，进一步增强系统的能力。例如，可以调用实时的天气API、新闻API，甚至是对外部数据库的查询接口。

- **API 集成**：通过与外部API的集成，RAG应用可以实时地从外部获取数据，用于回答复杂问题或生成内容。
- **自定义函数**：根据应用场景，可以定制化调用本地或远程函数来扩展RAG应用的功能。

## 功能亮点

- **高效的文档检索与语义匹配**：利用 Elasticsearch 和向量搜索，确保快速准确地从大量数据中提取相关信息。
- **智能对话生成**：基于大规模预训练的生成模型，提供高质量的自然语言对话。
- **状态管理与个性化体验**：通过 Redis 缓存会话状态，实现上下文跟踪和个性化定制。
- **灵活的扩展性**：支持外部API调用，轻松集成其他系统或服务。

## 系统预览
![输入图片说明](1740458639882.jpg)

![输入图片说明](1740458639891.jpg)

![输入图片说明](fcd2f586de72e20310ec307713d530a.png)