# recommended_server_usage **Repository Path**: qi-tianliang/recommended_server_usage ## Basic Information - **Project Name**: recommended_server_usage - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 7 - **Forks**: 0 - **Created**: 2020-12-19 - **Last Updated**: 2023-06-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # rtx3090服务器使用推荐方式 > 目前支持`cuda >= 11.0`, 低版本迁移存在未知坑。 ## 推荐方式 `docker + portainer` ## 配置环境 **样例**[conda_gpu_in_docker](https://gitee.com/qi-tianliang/conda_gpu_in_docker) ## portainer容器管理页面 * 用户,密码管理员给你初始账号,请记得更改密码 * 占用端口,请填写[ports used](ports_used.md)(网页可填),并告知管理员 * 文件路径映射请按照规则配置,你的工作目录请映射到host : `/data/your_name/` * GPU 如果你代码中不控制使用量,请在配置时,限制GPU个数 * **GPU资源分配** * 请研一同学尽量使用0号 * 研二同学使用1,2号 * 其他有毕业和发文章需求可以视情况使用0,1,2,3号 * CPU 如果你写并行,或者使用大型框架(dask,pytorch,tensorflow等),可能100%占用,请自行限制CPU个数 * 使用样例方法[conda_gpu_in_docker](https://gitee.com/qi-tianliang/conda_gpu_in_docker)构建的容器,ssh 账号密码记得`passwd`修改 访问地址ip:9000 * 登录页面 ![登录](./pngs/login.png) * 主页 ![主页](./pngs/index.png) * 控制面板 ![控制面板](./pngs/dashborad_normal.png) * 容器管理 ![容器管理](./pngs/container_normal.png) * 进入详细管理页面后 ![容器样例](./pngs/example_details.png) > 如果未见到该按钮说明权限未正确设置,联系管理员配置权限即可。 * 新创建的配置页面 ![容器管理](./pngs/add_container_part0.png) > 重要提醒,保证机器重启容器不被删除,需要在你确保一切正常后,重新创建该容器,并关闭这个`Auto remove`选项,可以保证不会在机器重启或者异常关机时自动删除。当然被删除了问题不大,重新创建就可以。 **例如** ![容器管理例子](./pngs/add_container_port.png) **个人端口范围记得跟管理员申请,请不要自行随意配置,避免冲突,详见**[ports used](ports_used.md) **服务器配置推荐,目录不会乱** ![容器目录映射](./pngs/add_container_part1_volume_normal.png) ![容器目录创建](./pngs/add_container_part1_volume_help.png) > 说明:使用物理机的共享内存是常用需求,如果你不确定是否需要,建议默认配置该项;conda环境持久化volume,并不是必须的,但是强烈建议,因为避免重建容器(修改容器部分参数必须重建)时丢失之前的python环境;个人工作目录是推荐的服务器使用目录,避免管理上的麻烦。 **服务器配置推荐,GPU不会全部抢占** ![容器环境变量](./pngs/add_container_part2_env.png) **服务器配置推荐,CPU内存不会100%占用** ![容器运行环境](./pngs/add_container_part3_runtime_resources.png) * 进入容器,修改预设的密码。 ![容器密码](./pngs/container_passwd.png) ### 镜像添加SSH * 构建image(**一般是为了添加ssh服务和一些源的配置**) ![构建入口](./pngs/build_image0.png) > 以下例子在[conda_gpu_in_docker](https://gitee.com/qi-tianliang/conda_gpu_in_docker)中有对应文件 * 方式1: `web editor`(**不能添加额外文件**) ![web_editor](./pngs/build_image1_web_editor.png) ssh-server 服务的添加,可以参考[web_editor](https://gitee.com/qi-tianliang/conda_gpu_in_docker/blob/master/web_editor.dockerfile)对pytorch环境添加ssh-server服务。 * 方式2: `tar`(**添加额外配置/文件**) ![tar_gz](./pngs/build_image2_tar.png) 更高需求的使用方式,在image中添加**额外的文件** ,一般这种文件从网上**下载很耗时**(如果下载很快,可以尝试`wget`直接拉取),或者**自定义的配置文件**,构建时需要使用`COPY`指令加入。 需要在tar.gz文件内,需要构建一个tar.gz文件 例如使用`tar cvzf pytorch_ssh.tar.gz .condarc Dockerfile SimHei.ttf`构建得到`pytorch_ssh.tar.gz`. * 方式3:`url`(**git url**) ![url](./pngs/build_image3_url.png) 跟方式2需求一致,但是该方式需要你将所有配置文件和Dockerfile 放在一个公开的git上进行管理。 ## 写在后面 希望大家提建议,共同遵守规则使用公共资源。 ​