
- 数据集概述
- 图像数量与分辨率:3293 张,1080×1920 竖屏高清
- 类别总数:4 类
- 标注格式:支持 YOLO、VOC、COCO
- 标注总框数:14,155
- 适用场景:智慧河道监控、应急救援、AI 巡检等
- 具体类别及数量分布
- 水边钓鱼:1404 图 / 2872 框
- 游泳溺水:1508 图 / 9347 框
- 钓鱼伞:210 图 / 429 框
- 船只:689 图 / 1507 框
- 数据分割
- 训练集:3234 张(≈98.2%)
- 验证集:47 张(≈1.4%)
- 测试集:12 张(≈0.4%)
- 模型与训练
- 支持标注格式:YOLO、VOC、COCO 全格式
- 核心模型:YOLOv11,适合高空视角、小目标密集与特殊长宽比任务
- 提供完整的训练与推理代码
- 转换与部署
- 支持 COCO/VOC 转 YOLO 的转换流程
- 提供将模型导出为 ONNX/TensorRT 的路径,便于边缘设备部署(如 Jetson 系列)
- 训练与优化建议
- 采用大骨干网络以提升对高分辨率场景的表现
- 动态缩放保持原始纵横比,避免拉伸失真
- 针对稀有类别进行复制粘贴增强
- 使用 Focal Loss 缓解类别不平衡
- 支持多尺度训练
- 边缘设备部署需考虑模型体积与推理性能
mile米乐
- 场景应用定位
- 禁钓区与非法船只自动识别
- 游泳者状态实时监测与溺水预警
- 无人机结合 GPS 的自主管理与异常上报
- 公园湖泊、水库等区域的景区安防提升
- 作为智慧城市数字孪生感知层接入统一平台
- 项目要点总结
- 数据集总量:3293 张,竖屏分辨率为 1080×1920
- 类别数:4;标注框总数:14,155
- 标注格式多样,核心模型为 YOLOv11,具备高空视角下的小目标密集检测能力