# paper-agent **Repository Path**: zhbchn/paper-agent ## Basic Information - **Project Name**: paper-agent - **Description**: 一款可以帮助经常阅读论文的同学提升效率的小工具,有两个部分: HuggingFace Weekly Paper 制作工具 Arxiv Helper 来自于:https://github.com/careywyr/paper-agent - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: dev - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-07-24 - **Last Updated**: 2024-07-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Paper-Agent 一款可以帮助经常阅读论文的同学提升效率的小工具,有两个部分: - HuggingFace Weekly Paper 制作工具 - Arxiv Helper ## 前置条件 翻译基于 `deepseek` 的服务, 论文十问依赖于 `kimi`, 因此需要这两个的 api key。可以配置到环境变量中,代码中使用的环境变量 key 分别是 - DEEPSEEK_KEY - KIMI_KEY 如果不想同时用两家,翻译可以考虑也换成 kimi,需要手动修改代码,将 deepseek 里面的设置换成 kimi的。 ## 1. HuggingFace Weekly Paper 制作工具 我每周博客和公众号上都会发一篇 weekly paper,文章来源于 HuggingFace 的 Daily Paper。 为了减少每次都要一个个点进去通过N次复制粘贴来得到翻译后的结果的痛苦,写了个脚本,可以直接读取本周的点赞超过n次的论文,并生成Weekly Paper。 代码就是hf.py文件,运行 `weekly_paper` 方法即可,慢慢等待即可,如果出现了一些翻译上的问题或者接口异常,可以重新从目录下的output.md文件里面拿到英文原版继续人工处理。 此脚本依赖的模型是 `deepseek`。 翻译 prompt 来自于微博上宝玉老师的分享。 ## 2. Arxiv Helper 这个使用 `streamlit` 做了前端,输入框里面输入 arxiv 论文的首页地址,回车即可得到它的标题和摘要,左侧可以进行翻译,右侧是[论文十问](http://leafw.cn/2023/12/25/%e5%88%86%e4%ba%ab%e4%b8%a4%e4%b8%aa%e9%98%85%e8%af%bb%e8%ae%ba%e6%96%87%e7%9a%84%e6%96%b9%e6%b3%95/)的模板,使用 `kimi` 的接口进行问答。 ![img.png](img.png) 对pdf的读写是依赖于kimi的基于文件的问答,因此会上传文件到kimi,文件上传列表可以在设置页面看到(初版暂时没做文件上传去重处理),不需要的可以删除。文件本身也会下载到data目录,每篇论文对应一个文件夹,里面存放pdf以及数据json,避免每次都要重新调用接口。 ![img_1.png](img_1.png) 使用方式: ``` shell streamlit run arxiv.py ``` ## 后续计划 1. arxiv helper 支持跳转到 kimi 聊天,并带上已经进行过的论文十问; 2. 论文上传去重 3. 本地论文管理(待定)