# cut2txt **Repository Path**: piyidao/cut2txt ## Basic Information - **Project Name**: cut2txt - **Description**: 一个本地运行的图片转文字工具,可将微信或QQ等截屏过的图片转为文字信息 - **Primary Language**: JavaScript - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2020-11-11 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 运行须知 ### 引言 在一次偶然的需求中,需要做一个图片转文字的功能(**需要支持中文**),后查阅很多开源技术,找到了[tesseract.js](https://github.com/naptha/tesseract.js#docs) ,它提供了多国语言的支持,并且也有相应的语言训练数据支持,使用起来相当方便。 > 当前项目是为基于浏览器的开发方式,来离线使用tesseract,使用时需要部署在HTTP服务器上 ### 运行项目 使用任意HTTP服务器部署当前目录(anywhere、http-server、tomcat、nginx等等均可) * **anywhere** 在项目的根目录执行 `anywhere 8000` * **http-server** : 在项目的根目录执行 `http-server -p 8000` 这里暂时介绍这两种,其余暂时不在这里过多的介绍 ### 遇到的问题 ``` tesseract.min.js:1 Uncaught Error: RuntimeError: abort(undefined). Build with -s ASSERTIONS=1 for more info. at tesseract.min.js:1 at Worker.e.onmessage (tesseract.min.js:1) (anonymous) @ tesseract.min.js:1 e.onmessage @ tesseract.min.js:1 ``` 以上报错会在启动服务后,调用Tesseract.recognize()函数时随机出现,在网上查询了很多方法都无果,在多次排查问题后,偶然发现,可能是HTTP服务器的问题,使用了基于**Node**的`http-server`和`anywhere`,发现二者均有概率出现以上的问题,最后尝试更改默认端口,发现不管是使用哪种HTTP服务器,**只有使用8000端口启动项目才能正常运行**,其他很多端口都不行,上github上也看有人提类似的issue,具体是什么原因,至今还是个迷..