# hitnet **Repository Path**: whitbyli/hitnet ## Basic Information - **Project Name**: hitnet - **Description**: 深度学习估计双目图像深度,生成 kitti 02 数据集深度 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 1 - **Created**: 2022-08-20 - **Last Updated**: 2024-03-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: 双目深度估计, 深度学习 ## README # hitnet #### 介绍 深度学习估计双目图像深度,谷歌团队提出神经网络模型,官方代码地址:https://github.com/google-research/google-research/tree/master/hitnet。 这里利用谷歌官方提供的模型,编写代码生成 Kitti 数据集深度,其中 hitnet 网络负责估计双目图像视差,然后根据双目相机模型 $depth = \dfrac{bf}{disparity}$ 计算图像深度,这里以 CV_32F 图像格式保存为 tiff 图像文件。 #### python环境搭建 python 环境主要架构为:python 3.8 + tensorflow-cpu==2.5.0,具体环境配置过程如下: ```bash conda create -n hitnet python==3.8 conda activate hitnet pip install tensorflow-cpu==2.5.0 numpy==1.19.5 opencv-python==3.4.17.63 ``` > 也可以安装 tensorflow-gpu 版本,不过需要配置 cuda 和 cudnn #### KITTI 数据集下载 这里使用 KITTI 02 数据集,可以去 KITTI 官网下载,这里提供百度网盘下载链接:https://pan.baidu.com/s/1CiFnDgyGgb_G1I1a_OpfZw 提取码: 6ase。 #### 代码运行 运行代码文件 `main.py`,生成 kitti 02 数据集深度,需要修改的变量为 `data_path` (数据集路径),如需运行其他数据集需要修改 `bf` 值(即双目基线与相机焦距之积)