# zvision

**Repository Path**: taj5/zvision

## Basic Information

- **Project Name**: zvision
- **Description**: supervision to detect
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-07-26
- **Last Updated**: 2025-07-26

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

- 2025/07/18 yolo12s是基于ultralytics官方yolo12s模型微调的人形识别模型，虽然名字一样
- 测试产生的大量图片，可以用ffmepg合并成视频，方便查看和分享，指令如下：
```bash
ffmpeg -framerate 24 -i frame%d.png -c:v libx264 -r 30 output.mp4 # 规则命名
ffmpeg -framerate 5 -pattern_type glob -i "*.png" -c:v libx264 output.mp4 # 不规则命名
```


# sahi切片参数建议

- 1920×1080 属于高清分辨率，若目标以中等大小为主（如行人、车辆，约占 50-300 像素），640×640 的切片既能完整包含目标，又不会因切片过大导致小目标检测模糊。
- 若目标普遍较小（如 10-50 像素），可适当减小切片尺寸（如 512×512），但需增大重叠率避免漏检。
- 若目标普遍较大（如占满半屏以上），可增大切片尺寸（如 768×768），但会增加计算量。
- 1920×1080 的图像用 640×640 切片时，横向可切 3 片（640×3=1920），纵向可切 2 片（640×2=1280，覆盖 1080），配合 20% 的重叠率（约 128 像素），既能保证边缘目标不被截断，又不会因重叠过多导致计算量激增。
- YOLO11 的默认输入尺寸为 640×640，切片尺寸与之匹配时，无需额外调整模型输入，减少预处理开销，检测效率更高


## test
yolo detect track model=models/uav.pt source=person.avi vid_stride=10
yolo detect predict model=y12_0718.pt source=person.avi vid_stride=10
<<<<<<< HEAD
=======


# message
## v1
```bash
key: "detections"
value:
{
  "detection_id": "uuid-123456",  // 唯一检测ID（用于追踪单次检测）
  "timestamp": 1690000000.123,    // 检测时间戳（Unix时间，精确到毫秒）
  "objects": [                    // 检测到的目标列表
    {
      "class_name": "uav",          // 目标类别
      "class_id": 0,              // 类别ID（与模型输出对应）
      "x_norm": 0.25,
      "y_norm": 0.122,
      "w_norm": 0.16,
      "h_norm": 0.552,
      "confidence": 0.95,         // 置信度（0-1）
      "track_id": "5"     // 跟踪ID（若启用目标跟踪，可选）
    },
  ]
}
```
===========================================================
## v2
{
  "detection_id": "uuid-123456",  // 唯一检测ID（用于追踪单次检测）
  "timestamp": 1690000000.123,    // 检测时间戳（Unix时间，精确到毫秒）
  "source": {                     // 视频源信息
    "type": "rtsp",               // 源类型：rtsp/usb/camera等
    "url": "rtsp://192.168.1.100:554/stream",  // 源地址
    "camera_id": "cam-001"        // 摄像头唯一标识（可选）
  },
  "frame_info": {                 // 帧信息
    "frame_id": 12345,            // 帧序号（自增）
    "width": 1920,                // 帧宽度
    "height": 1080,               // 帧高度
    "fps": 25.0                   // 帧率（可选）
  },
  "objects": [                    // 检测到的目标列表
    {
      "class": "person",          // 目标类别
      "class_id": 0,              // 类别ID（与模型输出对应）
      "bbox": [100, 200, 300, 400],  // 边界框 [x1, y1, x2, y2]
      "confidence": 0.95,         // 置信度（0-1）
      "track_id": "track-789"     // 跟踪ID（若启用目标跟踪，可选）
    },
    {
      "class": "car",
      "class_id": 2,
      "bbox": [500, 300, 700, 500],
      "confidence": 0.88,
      "track_id": "track-790"
    }
  ],
  "model_info": {                 // 模型信息（可选）
    "name": "yolov8n",
    "version": "1.0.0",
    "inference_time_ms": 25       // 推理耗时（毫秒）
  }
}
>>>>>>> a28cdee (feat: add redis client)