# AIAS **Repository Path**: yi-guozhou/AIAS ## Basic Information - **Project Name**: AIAS - **Description**: AIAS (AI Acceleration Suite) - 人工智能加速器套件。提供: 包括SDK,平台引擎,场景套件在内,合计超过100个项目组成的项目集。 - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: http://aias.top/ - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1098 - **Created**: 2023-08-21 - **Last Updated**: 2025-02-14 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
[![star](https://gitee.com/mymagicpower/AIAS/badge/star.svg?theme=gvp)](https://gitee.com/mymagicpower/AIAS/stargazers) [![fork](https://gitee.com/mymagicpower/AIAS/badge/fork.svg?theme=gvp)](https://gitee.com/mymagicpower/AIAS/members)






### 1: 面向 Java 程序员的 AI 训练平台【模型定制】 - 项目位置:AIAS/2_training_platform - 面向java程序员,满足图像识别分类定制化需求。 - 支持图像分类模型训练 - 支持图像1:1

AI 训练平台
- training

AI训练平台提供分类模型训练能力。
并以REST API形式为上层应用提供接口。
#### 1.1 使用说明: - https://zhuanlan.zhihu.com/p/21746563748 #### 1.2 Java 模型训练培训教程 - [1_简介](https://zhuanlan.zhihu.com/p/21970343809) - [2_模型库](https://zhuanlan.zhihu.com/p/21971423493) - [3_计算图](https://zhuanlan.zhihu.com/p/21972965668) - [4_数据集迭代器](https://zhuanlan.zhihu.com/p/21973590418) - [5_模型监听器](https://zhuanlan.zhihu.com/p/21974185659) - [6_保存和加载模型](https://zhuanlan.zhihu.com/p/21974854322) - [7_模型推理](https://zhuanlan.zhihu.com/p/21975384175) - [8_训练UI界面](https://zhuanlan.zhihu.com/p/21975767565) - [9_MLP网络](https://zhuanlan.zhihu.com/p/21976108949) - [10_Vgg16实现图片分类](https://zhuanlan.zhihu.com/p/21977082859) - [11_ResNet50 实现图片分类](https://zhuanlan.zhihu.com/p/21978360806) - [12_ResNet50-图像1:1比对](https://zhuanlan.zhihu.com/p/21979539629) - [13_yolo-目标检测](https://zhuanlan.zhihu.com/p/21981802325)


### 2: AI 能力平台【开箱即用】 - 项目位置:AIAS/3_api_platform - Web应用,前端VUE,后端Springboot - 可以直接部署使用,使用UI或者调用API集成到现有的系统中。 - 支持的能力清单: ```text 1). OCR文字识别 2). 机器翻译 3). 语音识别 4). 一键高清 5). 一键抠图 6). 黑白照片上色 ... ``` #### 使用说明: - https://zhuanlan.zhihu.com/p/21873070647

OCR文字识别

- 自由文本识别
支持旋转、倾斜的图片
- 文本图片转正

语音识别

- 英文语音识别
- 中文语音识别

202种语言互相翻译

- 支持202种语言互相翻译

图像增强

- 图片一键高清:
提升图片4倍分辨率

图像增强

- 头像一键高清

图像增强

- 人脸一键修复:
自动修复图中人脸

通用一键抠图

人体一键抠图

动漫一键抠图

框选一键抠图

黑白照片上色




### 3: 人工智能 sdk - 1_image_sdks - [图像识别 SDK] ```text 1). 工具箱系列:图像处理工具箱(静态图像) 2). 目标检测 3). 图像分割 4). GAN 5). 其它类别:OCR等 ... ```

OCR工具箱 1:方向检测

- ocr_sdks/
ocr_direction_det_sdk
- OCR图像预处理。

OCR工具箱 2:OCR文字识别

1. ocr_sdks/ocr_v3_sdk
1). V3 文本检测:
- 中文文本检测
- 英文文本检测
- 多语言文本检测
2). V3 文本识别:
- 中文简体
- 中文繁体
- 英文
- 韩语
- 日语
- 阿拉伯
- 梵文
- 泰米尔语
- 泰卢固语
- 卡纳达文
- 斯拉夫
2. ocr_sdks/ocr_v4_sdk
- 原生支持倾斜文本文字识别。
- 更高的识别精度
- 支持中英文。

OCR工具箱 4:版面分析

- ocr_sdks/ocr_layout_sdk
可以用于配合文字识别,
表格识别的流水线处理使用。
1). 中文版面分析
2). 英文版面分析
3). 中英文文档 - 表格区域检测

OCR工具箱 5: 表格识别

- ocr_sdks/ocr_table_sdk
- 中英文表格识别。

动物分类识别
- classification/animal_sdk

动物识别sdk,支持7978种动物的分类识别。

菜品分类识别
- classification/dish_sdk

菜品识别sdk,支持8416种菜品的分类识别。

烟火检测
- fire_smoke_sdk

烟火检测,给出检测框和置信度。

行人检测
- pedestrian_sdk

行人检测,给出检测框和置信度。

智慧工地检测
- smart_construction_sdk

支持检测的类别:人体,安全帽。

车辆检测
- vehicle_sdk

车辆检测,给出检测框和置信度。
- 2_nlp_sdks - [自然语言 SDK] ```text 1). 工具箱系列:sentencepiece,fastText,npy/npz文件处理等。 2). 大模型 3). 词向量 4). 机器翻译 ... ```

Sentencepiece分词
- kits/sentencepiece_sdk

Sentencepiece分词的Java实现。

jieba分词
- lexical_analysis/jieba_sdk

jieba分词java版本的简化实现。
- 3_audio_sdks - [语音处理 SDK] ```text 1). 工具箱系列:音素工具箱,librosa,java sound,javacv ffmpeg, fft, vad工具箱等。 2). 声音克隆 3). 语音合成 4). 声纹识别 5). 语音识别 ... ```

中文语音识别(ASR)

1. 短语音
- asr_whisper_sdk
2. 长语音
- asr_whisper_long_sdk

TTS 文本转为语音

- tts_sdk
- TTS 文本转为语音。
- 4_video_sdks - [视频解析SDK] ```text 1). 摄像头口罩检测 - camera_facemask_sdk 2). MP4检测口罩 - mp4_facemask_sdk 3). rtsp取流检测口罩 - rtsp_facemask_sdk ```

视频流分析

1. 摄像头口罩检测
- camera_facemask_sdk
2. MP4检测口罩
- mp4_facemask_sdk
3. rtsp取流检测口罩
- rtsp_facemask_sdk
- 5_bigdata_sdks - [大数据SDK] ```text 1). flink-情感倾向分析【英文】- flink_sentence_encoder_sdk 2). kafka-情感倾向分析【英文】- kafka_sentiment_analysis_sdk ... ```

大数据分析

flink-情感倾向分析
flink_sentiment_analysis_sdk
kafka-情感倾向分析
kafka_sentiment_analysis_sdk
针对带有主观描述的文本,
可自动判断该文本的情感极性类别并给出相应的置信度。



### 视频培训课程: 制作中...... - 相关源码 - 技术答疑 #### 培训课程系列1. 基础篇 - 1. JavaCV - java版的OpenCV实现传统图像处理(提供常用代码例子) - 2. NDArray - java版的numpy,用于高性能处理矩阵(提供常用代码例子) #### 培训课程系列2. 算法篇 - 1. 深度学习算法基础 - 基础知识:前馈神经网络,卷积神经网络,循环神经网络 - 图像识别:图像分类,图像分割,目标检测 - 2. java版的模型开发与训练 - 3. pytorch 模型开发与训练 #### 培训课程系列3. 应用篇 - JavaAI实战系列 - 1. 图像处理_SDK(培训常用图像处理,并提供可商用的源码) - 人脸工具箱 - 人脸高清修复 - 图文高清_黑白上色 - 2. NLP_SDK(培训常用自然语言处理,并提供可商用的源码) - 代码特征向量提取 - 中文特征向量提取 - 多语言文本特征向量提取 - 机器翻译 - 3. Web应用(培训如何开发web类应用,并提供可商用的源码) - OCR,OCR自定义模版 - 人脸搜索 - 以图搜图 - 图像文本跨模态搜索 - 文本搜索 - 代码语义搜索 - 一键抠图 - 图像高清 - 机器翻译 - 4. AIGC 图像生成(培训如何开发图像生成类应用,并提供可商用的源码) - AIGC提示词如何撰写 - 图像生成预处理 - 图像生成SD工具箱 - 模型微调(LoRA) - 5. AI桌面应用开发(培训如何开发桌面应用,并提供可商用的源码) - 大模型桌面应用 - OCR桌面应用 - 图像高清放大 - 6. 大模型 - 大模型算法原理(transformer,训练,微调,推理优化) - 知识库,RAG增强生成等 - 提示词工程


#### 其它研究专题: #### 1). AI + 量子计算
- 官网: http://www.qubits.top/ - Gitee: https://gitee.com/mymagicpower/qubits - GitHub: https://github.com/mymagicpower/qubits #### 2). AI + 生物医药
- 官网: http://www.biocomputing.top/ - Gitee: https://gitee.com/mymagicpower/bio-computing - GitHub: https://github.com/mymagicpower/bio-computing