# aster **Repository Path**: ali-1998/aster ## Basic Information - **Project Name**: aster - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-08-31 - **Last Updated**: 2024-08-31 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #ASTER:具有灵活校正功能的注意力场景文本识别器 ASTER是一种具有灵活校正机制的精确场景文本识别器。研究论文可以在[这里]找到(https://ieeexplore.ieee.org/abstract/document/8395027/). ![ASTER概述](Overview.png) ASTER的实现重用[Tensorflow Object Detection API]中的代码(https://github.com/tensorflow/models/tree/master/research/object_detection). ##更新 **[2019年7月13日]PyTorch[端口](https://github.com/ayumiymk/aster.pytorch)由[@ayumiymk]制作(https://github.com/ayumiymk).** ##更正(2018年10月22日) 我们发现了一个在代码中意外产生的错误,该错误只导致部分SVT图像被测试,并导致更高的结果。该错误已在commit[a7e8613]中修复(https://github.com/bgshih/aster/commit/a7e8613d6308e5a7aacb1237dfa0286d73cef342). 以下是SVT上的更正数字。结果仍然是最先进的,因此结论不受影响。 -SVT(50)ASTER:97.4%;星A:96.3%;星B:96.1%; -SVT(无):ASTER:89.5%;星A:80.2%;星B:81.6% ##先决条件 ASTER是用**TensorFlow r1.4**开发和测试的。更高版本可能不起作用。 ASTER需要[协议缓冲区](https://github.com/google/protobuf)(版本>=2.6)。此外,在Ubuntu 16.04中: ``` sudo apt安装cmake libcupti开发 pip3安装--用户protobuf tqdm numpy editdistance ``` ##安装 1.转到“c_ops/”并运行“build.sh”来构建自定义运算符 2.执行`protocaster/protos/*.proto--python_out=.`构建protobuf文件 3.在“PYTHONPATH”中添加“/path/to/aster”,或为每次运行设置此变量 ##演示 演示程序位于`aster/demo.py `,并附有预训练的模型文件,可在我们的[发布页面]上找到(https://github.com/bgshih/aster/releases). 在运行演示之前,下载“model demo.zip”并将其解压缩到“aster/presidents/demo/”下。 要运行演示,只需执行: ``` python3 aster/demo.py ``` 这将输出演示图像和校正图像的识别结果。 ##培训和飞行评估 几个流行场景文本数据集的数据准备脚本位于“aster/tools”下。请参阅他们的源代码以了解用法。 要运行示例培训,请执行 ``` python3 aster/train.py\ --exp_dir实验/演示\ --num_clones 2 ``` 更改“experiments/aster/trainval.prototxt”中的配置,以配置您自己的训练过程。 在培训过程中,您可以运行一个单独的程序来重复评估生成的检查点。 ``` python3 aster/eval.py\ --exp_dir实验/演示 ``` 评估配置也在“trainval.prototxt”中。 ##引文 如果你发现这个项目对你的研究有帮助,请引用以下论文: ``` @文章{bshi2018aster, 作者:施宝光 杨明坤和 王兴刚和 吕鹏源 丛瑶和 向白, title={ASTER:一种具有灵活校正的注意力场景文本识别器}, journal={IEEE模式分析和机器智能汇刊}, 体积={}, 数字={}, 页面={1-1}, 年份={2018}, } @正在进行中{ShiWLYB16, 作者:施宝光 王兴刚和 吕鹏源 丛瑶和 向白, title={具有自动校正的鲁棒场景文本识别}, booktitle={2016{IEEE}计算机视觉与模式识别会议, {CVPR}2016年,美国内华达州拉斯维加斯,2016年6月27日至30日}, 页数={4168--4176}, 年份={2016} } ``` 重要提示:尽管此软件在麻省理工学院获得许可,但我们的目的是使其免费用于学术研究目的。如果您打算在产品中使用它,我们建议您[联系我们](xbai@hust.edu.cn)关于可能的专利问题。