# 基于正倒排索引的Boost搜索引擎 **Repository Path**: in-early-summer/Boost_Search_Engine ## Basic Information - **Project Name**: 基于正倒排索引的Boost搜索引擎 - **Description**: 该仓库用于存放基于正倒排索引的Boost搜索引擎项目 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-09-30 - **Last Updated**: 2026-03-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 基于正倒排索引的Boost搜索引擎 #### 介绍 项目简介:该项目为基于正倒排索引的boost搜索引擎,目的是实现站内搜索boost库中的文档内容。 相较于大型搜索引擎,本项目搜索数据更垂直,数据量更小,因此本项目更加轻便,搜索速度也更快。 #### 项目原理 前驱工作:首先将boost库中的文档下载到磁盘中,进行去标签与数据清洗。然后创建正倒排索引,并将索引保存 搜索过程:用户通过搜索引擎搜索网页,通过GET方式上传http请求到服务端进行搜索任务。 服务端接收到请求后通过提前建立好的倒排索引找到对应的文档id,搜索存放在磁盘中的html文件后返回给用户。 返回结果会拼接成一个多个网页的title、desc和url组成的搜索结果页面。 #### 技术栈 c++ stl 准标准库boost jsoncpp cppjieba cpp-httplib html css javaScript juery Ajax #### 软件架构 软件架构说明 ```text ├── cpp-httplib -> /home/win/cpp-httplib ├── cppjieba -> /home/win/cppjieba/cppjieba/include/cppjieba ├── data │   ├── input │   └── raw_html ├── debug ├── debug.cc ├── dict -> /home/win/cppjieba/cppjieba/dict ├── http_server ├── http_server.cc ├── Index.hpp ├── log.hpp ├── Makefile ├── parser ├── parser.cc ├── Project_Guide.txt ├── README.en.md ├── README.md ├── Searcher.hpp ├── util.hpp └── wwwroot ├── home.html ├── index.html └── road.jpg ``` #### 安装教程 想直接使用可直接运行 ``` ./http_server ``` 若不放心可以重新对代码进行编译和运行,依次执行下面的命令 ``` make clean make ./http_server ``` #### 使用说明 1. 首次使用就找一个浏览器,输入你主机ip号:8080/home.html,例如:192.168.0.1:8080/home.html即可进行主页搜索 2. 在对话框内输入搜索关键字后可直接摁回车或点击搜索框旁边的放大镜均可跳转至搜索结果页面 3. 跳转至搜索页面后同样可以在搜索框内继续搜索 4. 在搜索结果页面找到合适的网页后即可点击跳转到相应的boost文档中 #### 效果展示 搜索引擎主页 ![搜索引擎主页](wwwroot/Effect_display_imageshowhome.jpg.png) 结果展示页面 ![结果展示页面](wwwroot/Effect_display_imageshowindex.jpg.png)