# AI应用开发平台 **Repository Path**: ai_projects/HGAI ## Basic Information - **Project Name**: AI应用开发平台 - **Description**: 一款基于JAVA语言开发的AI平台,采用springboot、JDK17,AI平台可以在线标注样本、开发算法代码、运行算法代码、在线模型训练、一键模型发布,实现AI开发的全流程平台化。平台提供了语义分割、目标识别、图片分类场景下的多种深度学习算法供用户使用。除直接使用平台内置的算法外,用户还可以上传自定义算法及模型,以满足更加个性化的模型训练及模型部署需求 - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2025-12-24 - **Last Updated**: 2025-12-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # AI应用开发平台 #### 介绍 一款基于JAVA语言开发的AI平台,采用springboot、JDK17,AI平台可以在线标注样本、开发算法代码、运行算法代码、在线模型训练、一键模型发布,实现AI开发的全流程平台化。平台提供了语义分割、目标识别、图片分类场景下的多种深度学习算法供用户使用。除直接使用平台内置的算法外,用户还可以上传自定义算法及模型,以满足更加个性化的模型训练及模型部署需求。 #### 软件架构 软件架构说明 ![输入图片说明](https://foruda.gitee.com/images/1740103199278028017/ce2d1313_7781311.png "微信图片_20250221095934.png") 基于Java语言开发的AI平台,与大部分企业信息化系统技术架构与开发语言保持一致,在现有团队及人员的配备下可以轻松的维护平台。具备极为出色的集成能力,能够快速实现与各类业务系统的无缝对接,确保数据的高效流转和业务的平滑整合。这些优势使得Java成为开发AI应用平台的理想选择,能够为企业提供高效、可靠且易于集成的智能化解决方案。 #### 一站式AI研发平台 - 全链路支持:覆盖数据标注、模型开发、训练到部署的完整AI研发流程,提供一站式解决方案。 - 丰富的算法库:内置多种先进算法,满足多样化的AI开发需求。 - 灵活的数据标注:支持图/文/音/多模态各类型标注能力,对接数据集模块。支持自动化标注,自定义设置自动化标注模型强大的框架兼容性 - 主流框架支持:内置TensorFlow、PyTorch等主流深度学习框架的镜像,确保与开源社区的无缝对接。 - 自定义镜像:支持多种自定义镜像方式,包括在原有镜像上构建、dockerfile构建,满足特定项目需求。 #### 个性化流程编排 - 功能组件化:内置丰富的功能组件,涵盖数据处理、模型训练、发布等环节。 - 定制化流程:支持用户根据项目需求个性化定制数据处理、训练和发布流程。 #### 灵活的模型部署 - 基础部署选项:支持使用Triton、MLServer等基础模型部署工具。 - 自定义脚本部署:允许用户通过自定义Python脚本实现模型部署,提供高度灵活性。 - 定制部署环境:支持创建定制的模型部署镜像,满足特殊部署需求。 #### 算力 • 云原生统筹平台cpu/gpu等算力 • 支持划分多资源组,支持多k8s集群,多地部署 • 支持T4/V100/A100/VGPU等异构GPU环境 • 支持边缘集群模式,支持边缘节点上开发/训练/推理 #### 存储 • 自带分布式存储,支持多机分布式下文件处理 • 支持外部存储挂载minio,支持项目挂载绑定 • 支持个人存储空间/组空间等多种形式 • 平台内存储空间不需要迁移 #### 分布式存储 AI应用开发平台会自动为用户挂载用户的个人目录,同一个用户在平台任何地方启动的容器,其用户个人子目录均为/mnt/$username。可以将pvc/hostpath/memory/configmap等挂载成容器目录,可以将对象存储minio的文件挂载到个人用户目录。同时可以在项目中配置项目的默认挂载,进而实现一个项目共享同一个目录等功能。 #### 在线开发 • 系统多实例管理,在线交互开发调试,无需安装三方控件,只需浏览器就能完成开发。 • 支持vscode,jupyter 在线IDE类型 • Jupyter支持AI 应用开发平台 sdk,,python 多内核版本 ![输入图片说明](1.png) #### 在线标注 • 支持图/文/音/多模态/大模型多种类型标注功能,用户管理,工作任务分发 • 对接AI应用模型市场,支持自动化标注;对接数据集,支持标注数据导入;对接pipeline,支持标注结果自动化训练 ![输入图片说明](2.png) #### pipeline编排 1、机器学习,全流程数据导入,数据预处理,超惨搜索,模型训练,模型评估,模型压缩,模型注册,服务上线,ml算法全流程 2、自动化工作流,支持单任务调试、分布式任务日志聚合查看,pipeline调试跟踪,任务运行资源监控,以及定时调度功能(包含补录,忽略,重试,依赖,并发限制,过期淘汰等功能) #### 推理服务 通过集成seldon 服务框架,实现 AI算法 推理服务。 发布推理服务从底层到上层,包含服务网格,serverless,pipeline,http框架,模型计算。 • 服务网格阶段:主要工作是代理流量的中转和管控,例如分流,镜像,限流,黑白名单之类的。 • serverless阶段:主要为服务的智能化运维,例如服务的激活,伸缩容,版本管理,蓝绿发布。 • pipeline阶段:主要为请求在各数据处理/推理之间的流动。推理的前后置处理逻辑等。 • http/grpc框架:主要为处理客户端的请求,准备推理样本,推理后作出响应。 • 模型计算:模型在cpu/gpu上对输入样本做前向计算。 主要功能: • 支持模型管理注册,灰度发布,版本回退,模型指标可视化,以及在piepline中进行模型注册 • 推理服务支持多集群,多资源组,异构gpu环境,平台资源统筹监控,VGPU,服务流量分流,复制,sidecar • 支持有代码和0代码的模型发布,gpu推理加速,支持训练推理混部,服务优先级,自定义指标弹性伸缩。 ![输入图片说明](image.png) #### 多分布式框架 以k8s,kubeflow为核心, 1、 支持tf分布式训练、pytorch分布式训练、ray分布式超参搜索、mpi分布式训练、nni分布式超参搜索、volcano分布式数据处理等 #### 联系 版权原因,开源部分代码,如有疑问可联系 ![输入图片说明](%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20250221103833.png)