# wechat_ocr **Repository Path**: strivespring/wechat_ocr ## Basic Information - **Project Name**: wechat_ocr - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-08-26 - **Last Updated**: 2025-08-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 简介 微信的ocr。拆箱即用。可以用一个函数ocr图片和pdf。 # 使用方式 把本工程的OCR文件夹复制到自己的工程目录下。 安装依赖: ` pip install wechat-ocr PyMuPDF ` 使用代码示例 ```python import OCR texts = OCR.wechat_ocr("QQ20250207-102251.png") #返回的是texts是一维列表 texts[文本块] 。比如取图片上第3个文本块(索引从0开始) : texts[3] print(f"ocr_picture:{texts}") """ 上面代码输出内容: ocr_picture:['如何看待《哪吒之魔童闹海》登顶中国电影票房榜首?', "'回卓收录 2025 新春放映室", '哪吒之魔童闹海 86% 知友推荐·8248 人评价', '中国大陆/喜剧·剧情·动画/2025-01-29 中国大陆/144分钟', '《哪吒之魔童闹海》总票房(含点映及预售)已超越《长津湖》票房,位列中国电影票房总榜榜首', '[图片】 更新:', '《哪吒2》超过《战狼2》,升至中国影史票房榜..显示全 部', '关注问题', '写回答', '邀请回答', '1,662 个回答', '枕巾加柠檬不 《', '你所喜欢的,终将成为你的热爱', '好问题 238', '● 142 条评论', '么 分享', '默认排序', '十 关注', '℅ 谢邀 @番石榴', '8420 人赞同了该回答', '2025年2月6日12点13分,中国电影史终于迎来属于自己的无冕之王,', '《哪吒之魔童闹海+》以雷霆之势登顶中国影史票房冠军,超越《长津湖》(57.75亿)和《战狼', '(56.94亿),而票房更是剑指终极预测的87亿大关,', '2》'] """ print("=========================") texts = OCR.ocr_pdf("QQ20250207-102251.png") # 返回的texts是二维列表 texts[pdf页][文本块]。 print(f"ocr_pdf:{texts}") """ ocr_pdf:[['如何看待《哪吒之魔童闹海》登顶中国电影票房榜首?', '圆卓收录 2025 新春放映室 )', '哪吒之魔童闹海 86% 知友推荐·8248 人评价', '中国大陆/喜剧·剧情·动画/2025-01-29 中国大陆/144分钟', '《哪吒之魔童闹海》总票房(含点映及预售)已超越《长津湖》票房,位列中国电影票房总榜榜首,', '[图片1 更新:', '《哪吒2》超过《战狼2》,升至中国影史票房榜….显示全部', '关注问题', '写回答', '邀请回答', '1.662 个回答', '枕巾加柠檬不 @', '你所喜欢的,终将成为你的热爱', '好问题 238', '●142 条评论', '么分享', '默认排序', '卜 关注', '9 谢邀 @ 番石榴', '8420 人赞同了该回答', '2025年2月6日12点13分,中国电影史终于迎来属于自己的无冕之王,', '(57.75亿)和《战狼', '《哪吒之魔童闹海+》以雷霆之势登顶中国影史票房冠军,超越 《长津湖》', '2》(56.94亿),而票房更是剑指终极预测的87亿大关。']] """ ```