# zvision **Repository Path**: taj5/zvision ## Basic Information - **Project Name**: zvision - **Description**: supervision to detect - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-07-26 - **Last Updated**: 2025-07-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README - 2025/07/18 yolo12s是基于ultralytics官方yolo12s模型微调的人形识别模型,虽然名字一样 - 测试产生的大量图片,可以用ffmepg合并成视频,方便查看和分享,指令如下: ```bash ffmpeg -framerate 24 -i frame%d.png -c:v libx264 -r 30 output.mp4 # 规则命名 ffmpeg -framerate 5 -pattern_type glob -i "*.png" -c:v libx264 output.mp4 # 不规则命名 ``` # sahi切片参数建议 - 1920×1080 属于高清分辨率,若目标以中等大小为主(如行人、车辆,约占 50-300 像素),640×640 的切片既能完整包含目标,又不会因切片过大导致小目标检测模糊。 - 若目标普遍较小(如 10-50 像素),可适当减小切片尺寸(如 512×512),但需增大重叠率避免漏检。 - 若目标普遍较大(如占满半屏以上),可增大切片尺寸(如 768×768),但会增加计算量。 - 1920×1080 的图像用 640×640 切片时,横向可切 3 片(640×3=1920),纵向可切 2 片(640×2=1280,覆盖 1080),配合 20% 的重叠率(约 128 像素),既能保证边缘目标不被截断,又不会因重叠过多导致计算量激增。 - YOLO11 的默认输入尺寸为 640×640,切片尺寸与之匹配时,无需额外调整模型输入,减少预处理开销,检测效率更高 ## test yolo detect track model=models/uav.pt source=person.avi vid_stride=10 yolo detect predict model=y12_0718.pt source=person.avi vid_stride=10 <<<<<<< HEAD ======= # message ## v1 ```bash key: "detections" value: { "detection_id": "uuid-123456", // 唯一检测ID(用于追踪单次检测) "timestamp": 1690000000.123, // 检测时间戳(Unix时间,精确到毫秒) "objects": [ // 检测到的目标列表 { "class_name": "uav", // 目标类别 "class_id": 0, // 类别ID(与模型输出对应) "x_norm": 0.25, "y_norm": 0.122, "w_norm": 0.16, "h_norm": 0.552, "confidence": 0.95, // 置信度(0-1) "track_id": "5" // 跟踪ID(若启用目标跟踪,可选) }, ] } ``` =========================================================== ## v2 { "detection_id": "uuid-123456", // 唯一检测ID(用于追踪单次检测) "timestamp": 1690000000.123, // 检测时间戳(Unix时间,精确到毫秒) "source": { // 视频源信息 "type": "rtsp", // 源类型:rtsp/usb/camera等 "url": "rtsp://192.168.1.100:554/stream", // 源地址 "camera_id": "cam-001" // 摄像头唯一标识(可选) }, "frame_info": { // 帧信息 "frame_id": 12345, // 帧序号(自增) "width": 1920, // 帧宽度 "height": 1080, // 帧高度 "fps": 25.0 // 帧率(可选) }, "objects": [ // 检测到的目标列表 { "class": "person", // 目标类别 "class_id": 0, // 类别ID(与模型输出对应) "bbox": [100, 200, 300, 400], // 边界框 [x1, y1, x2, y2] "confidence": 0.95, // 置信度(0-1) "track_id": "track-789" // 跟踪ID(若启用目标跟踪,可选) }, { "class": "car", "class_id": 2, "bbox": [500, 300, 700, 500], "confidence": 0.88, "track_id": "track-790" } ], "model_info": { // 模型信息(可选) "name": "yolov8n", "version": "1.0.0", "inference_time_ms": 25 // 推理耗时(毫秒) } } >>>>>>> a28cdee (feat: add redis client)