# PaddleOCRSharp **Repository Path**: lkitten/PaddleOCRSharp ## Basic Information - **Project Name**: PaddleOCRSharp - **Description**: PaddleOCRSharp是一个.NET的OCR工具本地类库,可离线使用。包含文本识别、文本检测、表格识别功能。本项目针对性能与精度做了大量优化,比飞桨原代码识别精度与性能均有所提高。 包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测。 - **Primary Language**: C# - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 46 - **Created**: 2026-01-17 - **Last Updated**: 2026-01-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## ⚠️ 重要免责声明 本开源仓库的核心代码(C#编写的调用/封装/扩展逻辑/示例)均为开源自由使用;仓库中所包含的其他第三方开源或者闭源的dll文件,其所有权、著作权、知识产权、商业授权许可、技术维护等全部归其原始开发方所有。 1. 本仓库仅提供开源的C#代码适配与调用封装,**不拥有其他第三方开源或者闭源的dll文件的任何权利,不提供该DLL的授权许可**; 2. 其他第三方开源或者闭源的dll文件的使用、分发、商业应用等行为,使用者可自行联系其权利人获取合法授权,**由此产生的一切法律责任、版权纠纷、商业风险均由使用者自行承担**,与本仓库及仓库作者无关; 3. 本仓库的开源代码仅为技术学习与适配,不保证闭源DLL的功能完整性、稳定性及合规性,使用者下载、使用本仓库即代表知晓并同意本声明。 [更新记录](https://gitee.com/raoyutian/PaddleOCRSharp/blob/master/doc/README_update.md) | 如果项目对你有用或者喜欢,那就点个赞★ 。谢谢! ## 介绍 ---- **PaddleOCRSharp** 是一个.NET版本OCR可离线使用类库。项目核心组件PaddleOCR.dll目前已经支持C\C++、.NET、Python、Golang、Rust、java、labview、delphi等众多开发语言的直接API接口调用。项目包含文本识别、文本检测、表格识别功能。本项目做了大量优化,提高了识别率和推理性能。包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持中英文、纯英文以及多种语言文本检测识别。 **PaddleOCRSharp**封装极其简化,实际调用仅几行代码,极大的方便了中下游开发者的使用和降低了PaddleOCR的使用入门级别,同时提供不同的.NET框架使用,方便各个行业应用开发与部署。Nuget包即装即用,可以离线部署,不需要网络就可以识别的高精度中英文OCR。 本项目支持官方所有公开的通用OCR模型,如:PPOCRV2、PPOCRV3、PPOCRV4、PP-OCRv4_server、PP-OCRv4_server_doc(1.5万字符字典模型)。PP-OCRV5、PP-OCRv5_server、en_PP-OCRV5,最新版默认使用中英文V5模型PP-OCRv5: ★windows系统支持:win7SP1_x64、win10_x64及以上、winserver2012R2_x64及以上。CPU指令集需要包含AVX2指令集。 本项目目前支持以下.NET框架(linux版本仅支持net6.0及以上框架): ``` net40;net45;net451;net452;net46;net461;net462;net47;net471;net472;net48;net481; netstandard2.0; net6.0;net7.0;net8.0;net9.0;net10.0 ``` ## 特点 ★ $\color{#0000FF}{高度集成}$:**PaddleOCRSharp**将OCR的核心功能完美集成到.NET平台,让开发者无需关心底层实现,只需调用相应接口即可实现OCR功能。 ★ $\color{#0000FF}{性能卓越}$:核心代码全部采用C++编译,并进行高度优化,**PaddleOCRSharp**在保持高度集成的同时,也保证了卓越的性能表现。 ★ $\color{#0000FF}{易于使用}$:**PaddleOCRSharp**提供了丰富的API接口和详细的文档说明,让开发者能够轻松上手,快速实现OCR功能。 ★ $\color{#0000FF}{扩展性强}$:**PaddleOCRSharp**支持自定义模型加载和训练,开发者可以根据自己的需求进行模型扩展和优化。 ★ $\color{#FF0000}{离线免费}$:**PaddleOCRSharp**支持离线绿色部署,无其他依赖需要安装,满足了众多开发者的福音。 ## 应用场景 **PaddleOCRSharp**适用于各种需要OCR技术的.NET开发场景,如文档数字化处理、自动识别表单数据、车牌识别等。无论是企业级应用还是个人开发者,**PaddleOCRSharp**都能提供强大的OCR支持。 ## 如何使用 [.NET使用PaddleOCRSharp](https://gitee.com/raoyutian/PaddleOCRSharp/blob/master/doc/UseInCsharp.md) [博客园文章:.NET框架下如何使用PaddleOCRSharp](https://www.cnblogs.com/raoyutian/p/15912470.html) [具体使用示例参考](https://gitee.com/raoyutian/PaddleOCRSharpDemo) ## 第三方组件链接 [第三方PaddleOCR组件链接](https://www.yingtianit.com/) ## PaddleOCRSharp适合哪些场景 PaddleOCRSharp主要应用场景: **文档数字化处理:** 对于大量的纸质文档,PaddleOCRSharp可以快速地将其转化为电子文档,方便存储、检索和编辑。这在企业级应用中尤为重要,如图书馆、档案馆、政府部门等需要对大量文档进行数字化处理的场景。 **自动识别表单数据:** 在需要自动化处理表单数据的场景中,PaddleOCRSharp可以识别表单中的文字信息,并将其转化为结构化数据。这大大提高了数据录入的效率和准确性,特别适用于银行、保险、医疗等行业需要处理大量表单数据的场景。 **车牌识别:** PaddleOCRSharp也支持车牌识别功能,可以准确地识别出车辆的车牌号码。这对于交通管理、停车场管理、安防监控等场景非常有用,可以帮助实现车辆的快速识别和追踪。 **图像文字提取:** 在需要从图像中提取文字信息的场景中,如从截图、图片或PDF文件中提取文字,PaddleOCRSharp都能提供高精度的识别结果。这对于研究人员、学者、学生等需要处理大量图像文字信息的用户来说非常便捷。 **多语言识别:** PaddleOCRSharp支持多种语言的识别,包括中文、英文等常用语言。这使得它可以在国际化的应用场景中发挥重要作用,如跨境电商、国际交流等领域。 **定制化需求:** 对于有特殊需求的用户,PaddleOCRSharp提供了丰富的接口和模型库,可以根据具体需求进行定制化和扩展。这为用户提供了更多的灵活性和可能性,可以满足不同场景下的特定需求。 PaddleOCRSharp凭借其强大的OCR功能和广泛的应用场景,成为了.NET开发者在处理OCR任务时的有力工具。无论是企业级应用还是个人开发者,都可以通过PaddleOCRSharp快速实现OCR功能,提高工作效率和数据处理的准确性。 ## 常见问题与解决方案 [常见问题与解决方案](https://gitee.com/raoyutian/PaddleOCRSharp/blob/master/doc/README_question.md) ## 技术交流方式 ------ #### QQ技术交流群:318860399 #### [个人博客地址: https://www.cnblogs.com/raoyutian/]( https://www.cnblogs.com/raoyutian/) ----- #### 定制开发联系QQ:277784829 -----