# 研究生以来的资源 **Repository Path**: ncepu_liudong/MyData ## Basic Information - **Project Name**: 研究生以来的资源 - **Description**: No description available - **Primary Language**: Unknown - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 6 - **Forks**: 2 - **Created**: 2021-07-29 - **Last Updated**: 2025-05-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README - [研究生以来的资源](#研究生以来的资源) - [虚拟现实](#虚拟现实) - [Python](#python) - [机器学习、深度学习、数据挖掘](#机器学习深度学习数据挖掘) - [数据集](#数据集) - [算法主机](#算法主机) # 研究生以来的资源 `研究生期间学习和使用过的资源,给大家分享一下。` ## 虚拟现实 `虚拟现实使用的硬件是Oculus Rift S,开发基于Unity3D和Oculus的平台,之前项目做了虚拟现实的风电场和变电站。` - 【模型】风电机组、变电站、变压器。这些在工作组里面我的电脑上。 - 【项目源码】两个项目的源码,在工作组里面我的电脑上。 - 【C#】Unity3D的脚本需要用C#编写,这部分需要熟悉C#的基础,可以看[菜鸟教程](https://www.runoob.com/csharp/csharp-tutorial.html).前半部分足以应对写脚本的需要了。 - 【Oculus】Oculus的开发,可以看它官网的demo多跑一跑程序,基于Oculus开发虚拟现实程序高度依赖官方提供的JDK,实现其特有的抓取,菜单等功能。CSDN上有一些介绍,[VR的介绍](https://blog.csdn.net/liulong1567/category_6042453.html),以及[Oculus Rift S的介绍和使用](https://blog.csdn.net/weixin_38239050/category_9381906.html). - 【HTC view】以及【Honlolens】这些没使用过,工训有相关的设备可以联系老师借用。 ---- ## Python - 【Anaconda】Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等,带有Jupyter Notebook,入门强烈建议在notebook上写python,国外网站比较慢,可以在[清华源下载](https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/) - 【python基础】python基础推荐[廖雪峰的教程](https://www.liaoxuefeng.com/wiki/1016959663602400),教程浅显易懂,足够cover住python的基础使用了。 - 【python进阶】如果你想**在python里一直一直肝**,强烈推荐你看[python100天](https://github.com/jackfrued/Python-100-Days),里面涵盖python能做到的所有事情,Django,爬虫,数据分析,自动化测试............,看完这个就会觉得,python是世界上最好的语言! - 【Python小例子】别的语言可以做的事情,python可以做得更好,向大家推荐[《Python小例子》github](https://github.com/jackzhenguo/python-small-examples),以及[Python中文网《Python200例》](http://www.zglg.work/python-small-examples/),如果GitHub打不开,可以看我仓库里的镜像[Python小例子](https://gitee.com/ncepu_liudong/python-small-examples),各个方面的案例都有,都可以拿来即用。 - 【DRF】Django REST Framwork,python经典的后台框架,rest风格,前后端分离,[感兴趣可以看看](https://www.bilibili.com/video/BV1mz4y1Q7F4)。 ---- ## 机器学习、深度学习、数据挖掘 - 【机器学习入门】西瓜书,南瓜书,统计学习方法,对于这方面,网上有着大量的学习资料,DataWhale和马老师也做过相应的入门,大家对这部分的学习可能稍显困难,但是学一学好处是很多的,大家加油。 - 【深度学习入门1】可以看相关的书籍,推荐在线书[《动手学深度学习》](http://zh.d2l.ai/index.html),选择pytorch或者tensorflow版本,在Jupyter里面把代码跑一跑。 - 【深度学习入门2】之前应系里老师的要求,给其他实验室的同学们讲过深度学习入门,给咱们的同学也讲过一次,[相应的课件](https://gitee.com/ncepu_liudong/how-to-learn-deep-learning)可以查看一下。里面的内容包括:软硬件选择,深度学习环境搭建,数据操作,数据预处理,深度学习基础,预测的示例,识别的示例。 - 【数据挖掘】数据挖掘我主要是使用神经网络,参加天池比赛预测二手车价格,预测厄尔尼诺现象,感兴趣可以打打比赛,[阿里云天池](https://tianchi.aliyun.com/competition/gameList/coupleList)上有很多比赛,**打比赛是提升自己能力的最好方式**,把眼界放宽,不要拘泥于实验室,拘泥于华电,要多和优秀的同学交流,和拥有先进技术公司的人交流,会有很多智慧的火花碰撞出来的。 - 【计算机视觉】目标检测是我的研究方向,也是分享资源最多的地方。 - 【论文集】推荐大家多看看最新的论文,多体验最新的模型。CVPR、ICCV、ECCV、NIPS这些顶会是大家努力的方向!!!大家可以关注下[CV方向开源论文合集](https://github.com/amusi/CVPR2022-Papers-with-Code), [gitee镜像指路](https://gitee.com/mirrors_amusi/daily-paper-computer-vision),看论文会有些乏味,但真的有用,多用用百度翻译,谷歌翻译,CSDN和知乎上也会有好心人翻译这些论文。很多论文会有github上的代码,多试试多跑跑。 - 【数据集】实验室公用的算法主机上有VOC和COCO的官方数据集,也有自行制作的变电站设备缺陷数据集,变电站人员行为数据集,飞机编号和部件数据集,大家都可以自行取用。 - 综述性内容,[目标检测阶段性成果以及论文](https://github.com/hoya012/deep_learning_object_detection),GitHub打不开的话,可以看这个[gitee上的镜像](https://gitee.com/mirrors_hoya012/deep_learning_object_detection),作者总结的很全面,很适合新手入门。 - 【算法模型1】新手可以尝试自己跑一下[YOLOv4](https://github.com/AlexeyAB/darknet),一方面它是单阶段目标检测算法的代表成果,另一方面因为它对硬件的要求相对较低。用coco数据集跑一次,再自己标注一个简单的数据集跑一次。 - 【算法模型2】我现在主要用商汤的MMdetection工具箱,我已经测试了各种常用的目标检测模型。1.0版本和2.0版本的环境都已经搭建好了,大家可以在算法主机直接用,稍后我会整理好我的论文思路和成果。 - 【其他】训练环境的搭建,模型训练中的各种问题等等都可以交流。 ---- ## 数据集 - 一部分数据集在实验室算法主机上,路径如下。 - ![image.png](https://s2.loli.net/2022/04/09/p2iBfebNAl9MkQ5.png) - 数据集格式如下 - COCO - 官方的coco标准数据集,网上有的都在这儿了。 - VOC - 官方的VOC格式数据集,网上有的都在这儿了。 - ElectricDataSets - 数据集来自电网,图片的内容是变电站施工人员的着装、动作、设备等,里面有三个数据集,例子:图片文件夹(1_images)和标注文件(1train.csv)相对应构成一个数据集。 - **数据集涉及到其他公司,这个数据集不允许外传** - VOC2007-byq - 这个是我训练模型的数据集,图片的内容是变电站中设备的渗漏油、金属锈蚀、异物悬挂等。里面既有xml的标注文件,也有json的标注文件,可以按需使用。 - 标签的类别请参考文件夹下的**readme.txt** - **数据集涉及到其他公司,这个数据集不允许外传** - VOC-Aircraft - 数据集来自合作的公司,标注了飞机编号的数字和字母以及一个飞机上的部件。 - **数据集涉及到其他公司,这个数据集不允许外传** - VOC-MeterReading - 表计读数数据集,暂时没用过,大家感兴趣可以探索一下。 - VOC2007-byq、VOC-Aircraft两个数据集中4000余张图片由同学们手动标注,一个框一个框画出来很是辛苦,下面列出他们的名字表示感谢(排名不分先后)。 - 马彬、严奕凯、孙佳晨、李丞涵 - 一部分数据集在实验室的网盘上 - 校园网内部登录即可获取,下载速度还是很快的。 - ![image.png](https://s2.loli.net/2022/04/09/evpkJ1SjbT9W8Cf.png) - 数据集是同学们收集之后贡献出来的,感恩无私的精神。 - “变电站缺陷检测书记集”中有(30G左右)变电站设备缺陷的图片,缺陷类型有十几类,还未标注,感兴趣可以自由探索一下。独家数据集不失为一个应用的新方向。 ---- ## 算法主机 `实验室提供算法主机,大家登记使用。`