基于某个网站的站内搜索引擎 可以根据需求下载不同的离线 html 文档实现不同网站的站内搜索,对 html 文档完成去标签化 根据去标签化后的文档,进行分词、权重计算,建立正排索引与倒排索引,用于搜索 对搜索关键词进行分词,根据相关度对搜索结果排序,并以Json字符串形式返回结果 实现了文档记录、竞价排名、去掉暂停词的功能 模拟httplib库实现了HTTP服务,其中TCP采用多路转接的方案实现
最近更新: 1年多前个人比较喜欢界面设计与开发,这里将会存有自己整合与编写的开源工程
最近更新: 1年多前