PDF文档结构识别 :本项目意图从PDF中识别标题、作者、图表、正文等内容进行分割提取,输入PDF文献,输出得到文本识别分类后的HTML格式文档(标题、作者、摘要、正文标题、正文、参考文献),图片与表格文件(图表注一起打包)。
PDF文档结构识别 :本项目意图从PDF中识别标题、作者、图表、正文等内容进行分割提取,输入PDF文献,输出得到文本识别分类后的HTML格式文档(标题、作者、摘要、正文标题、正文、参考文献),图片与表格文件(图表注一起打包)。
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。