DAMO-YOLO进阶教程：批量处理图片，命令行一键完成大量检测

📅 发布时间：2026/7/4 22:05:32 👁️ 浏览次数：

DAMO-YOLO进阶教程批量处理图片命令行一键完成大量检测如果你已经体验过DAMO-YOLO那个酷炫的赛博朋克界面用它一张张地检测图片可能会觉得效率有点低。想象一下你手头有几百张、甚至几千张图片需要分析——比如整理一个月的监控录像截图、处理电商平台的商品图库或者分析一个大型活动的所有照片。这时候一张张上传、等待、保存结果显然不是个好办法。今天我就带你解锁DAMO-YOLO的进阶玩法命令行批量处理。我们将彻底告别手动操作用几行命令让系统自动、高效地处理海量图片把时间还给更有价值的工作。1. 为什么需要命令行批量处理在深入技术细节之前我们先搞清楚为什么图形界面之外还需要命令行工具。图形界面Web UI的局限性效率瓶颈一次只能处理一张图片上传、等待、下载结果流程繁琐。难以自动化无法集成到自动化脚本或工作流中比如每天定时分析新图片。不适合服务器对于没有图形界面的服务器环境Web UI无法使用。命令行批量处理的优势一键处理海量数据一个命令处理整个文件夹的图片解放双手。无缝集成可以轻松嵌入到Python脚本、Shell脚本、定时任务Cron Job或CI/CD流程中。资源可控可以更精细地控制GPU/CPU的使用优化处理顺序甚至分布式处理。结果结构化自动将检测结果如边界框坐标、类别、置信度保存为JSON或TXT文件方便后续程序分析。简单来说图形界面适合探索和单次任务命令行则是为规模化、自动化生产而生。接下来我们就来搭建这个高效的生产流水线。2. 环境准备与脚本解析DAMO-YOLO镜像已经为我们准备好了强大的后端引擎。要进行批量处理我们需要理解其核心并编写一个驱动脚本。2.1 理解核心服务当你运行bash /root/build/start.sh时它启动了一个基于Flask的Python Web服务。这个服务提供了我们之前在浏览器里调用的API接口。批量处理的本质就是绕过浏览器直接通过代码调用这些API。服务的主要能力封装在/root/ai-models/iic/cv_tinynas_object-detection_damoyolo/路径下的模型文件中。我们的脚本需要加载这个模型并对输入的图片进行推理。2.2 创建批量处理脚本我们在工作目录下创建一个Python脚本比如叫batch_damoyolo.py。这个脚本将承担核心工作。#!/usr/bin/env python3 # -*- coding: utf-8 -*- DAMO-YOLO 批量图片检测脚本作者你的名字功能遍历指定文件夹内的所有图片使用DAMO-YOLO进行目标检测并保存可视化结果和检测数据。 import os import sys import argparse import glob import time import json from pathlib import Path import cv2 import torch from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks from PIL import Image import numpy as np def parse_args(): 解析命令行参数 parser argparse.ArgumentParser(descriptionDAMO-YOLO批量图片检测工具) parser.add_argument(--input-dir, -i, typestr, requiredTrue, help输入图片所在的文件夹路径) parser.add_argument(--output-dir, -o, typestr, default./detection_results, help输出结果文件夹路径默认 ./detection_results) parser.add_argument(--conf-threshold, -c, typefloat, default0.5, help检测置信度阈值 (0-1)默认 0.5) parser.add_argument(--save-txt, actionstore_true, help是否保存检测框的文本数据YOLO格式) parser.add_argument(--save-json, actionstore_true, help是否保存详细的检测结果到JSON文件) parser.add_argument(--device, -d, typestr, defaultcuda:0, help推理设备cuda:0 或 cpu默认 cuda:0) return parser.parse_args() def main(): args parse_args() # 1. 检查输入目录 input_dir Path(args.input_dir) if not input_dir.exists() or not input_dir.is_dir(): print(f[错误] 输入目录不存在或不是一个文件夹: {args.input_dir}) sys.exit(1) # 2. 创建输出目录 output_dir Path(args.output_dir) output_dir.mkdir(parentsTrue, exist_okTrue) images_output_dir output_dir / images_with_boxes images_output_dir.mkdir(exist_okTrue) if args.save_txt: txt_output_dir output_dir / labels txt_output_dir.mkdir(exist_okTrue) # 3. 初始化DAMO-YOLO检测管道 print([信息] 正在初始化DAMO-YOLO模型...) try: # 使用ModelScope的pipeline加载达摩院官方模型 model_dir /root/ai-models/iic/cv_tinynas_object-detection_damoyolo/ object_detect pipeline(Tasks.image_object_detection, modelmodel_dir, deviceargs.device) print([信息] 模型加载成功) except Exception as e: print(f[错误] 模型加载失败: {e}) sys.exit(1) # 4. 查找所有支持的图片文件 image_extensions [*.jpg, *.jpeg, *.png, *.bmp, *.tiff] image_paths [] for ext in image_extensions: image_paths.extend(glob.glob(str(input_dir / ext), recursiveFalse)) image_paths.extend(glob.glob(str(input_dir / ext.upper()), recursiveFalse)) if not image_paths: print(f[警告] 在目录 {args.input_dir} 中未找到任何图片文件 (支持: jpg, png, bmp, tiff)) sys.exit(0) print(f[信息] 共找到 {len(image_paths)} 张待处理图片。) # 5. 批量处理循环 total_time 0 processed_count 0 for idx, img_path in enumerate(image_paths, 1): img_path Path(img_path) print(f\n[进度] 正在处理 ({idx}/{len(image_paths)}): {img_path.name}) try: # 读取图片 img cv2.imread(str(img_path)) if img is None: print(f [跳过] 无法读取图片: {img_path.name}) continue # 记录开始时间 start_time time.time() # 执行目标检测 # 注意ModelScope pipeline期望PIL Image或文件路径 result object_detect(str(img_path)) # 计算处理时间 inference_time time.time() - start_time total_time inference_time processed_count 1 print(f 推理耗时: {inference_time:.3f} 秒) # 6. 解析并过滤结果 detections result[boxes] # 获取检测框列表 scores result[scores] # 置信度列表 labels result[labels] # 类别标签列表 # 根据置信度阈值过滤 keep_indices [i for i, score in enumerate(scores) if score args.conf_threshold] filtered_boxes [detections[i] for i in keep_indices] filtered_scores [scores[i] for i in keep_indices] filtered_labels [labels[i] for i in keep_indices] print(f 检测到 {len(filtered_boxes)} 个目标 (阈值 {args.conf_threshold})) # 7. 在图片上绘制检测框赛博朋克绿色风格 img_with_boxes img.copy() for box, score, label in zip(filtered_boxes, filtered_scores, filtered_labels): # 解析框坐标 [x1, y1, x2, y2] x1, y1, x2, y2 map(int, box) # 绘制绿色矩形框 (BGR格式: 0, 255, 0 是绿色) color (0, 255, 0) # 纯绿色接近Web UI的霓虹绿 thickness 2 cv2.rectangle(img_with_boxes, (x1, y1), (x2, y2), color, thickness) # 添加标签和置信度文本 label_text f{label}: {score:.2f} (text_width, text_height), baseline cv2.getTextSize( label_text, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 1) # 文本背景框 cv2.rectangle(img_with_boxes, (x1, y1 - text_height - 5), (x1 text_width, y1), color, -1) # -1 表示填充 # 文本 cv2.putText(img_with_boxes, label_text, (x1, y1 - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 1) # 黑色文字 # 8. 保存带检测框的图片 output_image_path images_output_dir / img_path.name cv2.imwrite(str(output_image_path), img_with_boxes) # 9. 保存文本格式的检测结果 (YOLO格式: class_id x_center y_center width height) if args.save_txt: txt_filename img_path.stem .txt txt_path txt_output_dir / txt_filename img_height, img_width img.shape[:2] with open(txt_path, w) as f: for box, label in zip(filtered_boxes, filtered_labels): x1, y1, x2, y2 box # 转换为YOLO格式 (归一化中心坐标和宽高) x_center (x1 x2) / 2 / img_width y_center (y1 y2) / 2 / img_height width (x2 - x1) / img_width height (y2 - y1) / img_height # 这里需要将label映射为类别ID假设是COCO的80类 # 注意实际需要根据模型输出的label进行映射 # 此处为示例实际使用时需要调整 class_id 0 # 示例应替换为实际映射 f.write(f{class_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n) # 10. 保存JSON格式的详细结果 if args.save_json: json_result { image_name: img_path.name, image_size: {width: img_width, height: img_height}, detections: [], inference_time: inference_time, confidence_threshold: args.conf_threshold } for box, score, label in zip(filtered_boxes, filtered_scores, filtered_labels): x1, y1, x2, y2 map(float, box) json_result[detections].append({ label: label, confidence: float(score), bbox: { x1: x1, y1: y1, x2: x2, y2: y2, width: x2 - x1, height: y2 - y1 } }) json_filename img_path.stem .json json_path output_dir / json_results / json_filename (output_dir / json_results).mkdir(exist_okTrue) with open(json_path, w, encodingutf-8) as f: json.dump(json_result, f, indent2, ensure_asciiFalse) except Exception as e: print(f [错误] 处理图片 {img_path.name} 时出错: {e}) continue # 11. 打印统计信息 print(\n *50) print([批量处理完成]) print(*50) if processed_count 0: avg_time total_time / processed_count print(f处理图片总数: {processed_count}) print(f总耗时: {total_time:.2f} 秒) print(f平均每张图片耗时: {avg_time:.3f} 秒) print(f输出目录: {output_dir.absolute()}) print(f - 带检测框的图片: {images_output_dir.absolute()}) if args.save_txt: print(f - 标签文件 (YOLO格式): {(output_dir / labels).absolute()}) if args.save_json: print(f - 详细结果 (JSON): {(output_dir / json_results).absolute()}) else: print(没有成功处理任何图片。) if __name__ __main__: main()这个脚本就是我们的批量处理核心工具。它做了以下几件关键事情参数解析让你可以通过命令行灵活指定输入输出目录、置信度阈值等。模型加载使用ModelScope框架加载DAMO-YOLO官方模型。遍历图片自动扫描输入文件夹下的所有图片文件。批量推理对每张图片调用模型进行检测。结果过滤根据你设置的置信度阈值过滤掉不可靠的检测结果。可视化与保存在图片上画出绿色的检测框保持Web UI风格并保存为新图片。数据导出可选地保存为YOLO格式的文本文件或结构化的JSON文件供后续分析。3. 一键批量处理实战脚本准备好了让我们看看怎么用它。3.1 基本使用处理一个文件夹假设你所有的图片都放在/home/user/my_images文件夹里。打开终端进入脚本所在目录运行python batch_damoyolo.py --input-dir /home/user/my_images就这么简单脚本会自动加载模型。扫描/home/user/my_images下的所有JPG、PNG等图片。以默认0.5的置信度进行检测。把画好框的结果图片保存到当前目录下的./detection_results/images_with_boxes/里。3.2 进阶参数控制输出与精度命令行提供了多个参数让你精细控制处理过程指定输出位置和置信度python batch_damoyolo.py -i ./raw_photos -o ./my_detection -c 0.7这会将./raw_photos的图片以更严格的0.7置信度检测结果输出到./my_detection。保存检测数据用于后续分析python batch_damoyolo.py -i ./input -o ./output --save-txt --save-json除了图片还会生成labels/文件夹YOLO格式标签和json_results/文件夹包含每个框的详细坐标和置信度。在CPU上运行如果没有GPUpython batch_damoyolo.py -i ./input -d cpu速度会慢很多但可以在任何机器上运行。3.3 集成到自动化工作流这才是命令行的威力所在。你可以把它写进脚本实现全自动处理。示例每日自动处理监控截图假设你有一个摄像头每天把截图存到/mnt/security_cam/2024-06-15/这样的日期文件夹里。创建一个Shell脚本daily_detection.sh#!/bin/bash # 每日自动检测脚本 # 1. 获取昨天的日期 YESTERDAY$(date -d yesterday %Y-%m-%d) INPUT_DIR/mnt/security_cam/${YESTERDAY} OUTPUT_DIR/mnt/detection_results/${YESTERDAY} # 2. 检查是否有新图片 if [ -d $INPUT_DIR ] [ $(ls -A $INPUT_DIR 2/dev/null) ]; then echo 开始处理 ${YESTERDAY} 的监控图片... # 3. 调用我们的批量处理脚本 python /path/to/batch_damoyolo.py \ --input-dir $INPUT_DIR \ --output-dir $OUTPUT_DIR \ --conf-threshold 0.6 \ --save-json # 4. 发送处理完成通知可选 echo 处理完成结果保存在: $OUTPUT_DIR | mail -s 监控图片检测完成 ${YESTERDAY} your-emailexample.com else echo 没有找到 ${YESTERDAY} 的图片跳过处理。 fi然后使用crontab设置每天凌晨2点自动运行# 编辑crontab crontab -e # 添加一行 0 2 * * * /bin/bash /path/to/daily_detection.sh /var/log/damoyolo_daily.log 21这样你就建立了一个完全无人值守的智能监控图片分析系统。4. 处理结果与应用运行完成后打开输出目录你会看到整齐的结果。4.1 结果文件结构detection_results/ ├── images_with_boxes/ # 所有带绿色检测框的图片 │ ├── photo1.jpg │ ├── photo2.jpg │ └── ... ├── labels/ # 如果启用YOLO格式标签可用于模型训练 │ ├── photo1.txt │ └── ... └── json_results/ # 如果启用结构化JSON数据用于数据分析 ├── photo1.json └── ...4.2 结果数据分析示例JSON文件里包含了丰富的信息你可以用Python轻松进行统计分析import json from collections import Counter import os def analyze_detection_results(json_dir): 分析批量检测结果 all_detections [] class_counter Counter() # 遍历所有JSON文件 for json_file in os.listdir(json_dir): if json_file.endswith(.json): with open(os.path.join(json_dir, json_file), r) as f: data json.load(f) for det in data[detections]: all_detections.append(det) class_counter[det[label]] 1 # 打印统计信息 print(f总共分析了 {len(all_detections)} 个检测目标) print(\n目标类别分布:) for cls, count in class_counter.most_common(10): # 显示最多的10类 print(f {cls}: {count} 次) # 计算平均置信度 if all_detections: avg_confidence sum(d[confidence] for d in all_detections) / len(all_detections) print(f\n平均检测置信度: {avg_confidence:.3f}) return all_detections, class_counter # 使用示例 results, stats analyze_detection_results(./detection_results/json_results/)这段代码能帮你快速了解这批图片里什么物体出现得最多以及模型的整体检测把握度对于评估场景或模型性能非常有用。5. 性能优化与问题排查处理大量图片时效率是关键。这里有一些小技巧5.1 提升处理速度确保使用GPU默认-d cuda:0会使用GPU速度比CPU快几十倍。调整图片尺寸如果原图很大如4K可以在脚本读取图片后添加缩放代码减少计算量。批量推理更高级的用法是修改脚本将多张图片组合成一个批次batch送入模型能极大提升GPU利用率。这需要对PyTorch和数据加载有更深了解。5.2 常见问题解决ModuleNotFoundError: No module named modelscope确保你在DAMO-YOLO镜像环境内运行脚本。通过conda activate或直接使用镜像提供的Python环境。处理到一半程序崩溃可能是某张损坏的图片导致的。我们的脚本已经用try...except包裹了单张图片的处理逻辑会跳过错误图片继续运行。你可以查看打印的日志找到是哪张图出了问题。内存不足OOM Error如果图片太多或太大可能会撑爆GPU内存。可以尝试在脚本中降低处理分辨率。分多次处理每次处理一个子文件夹。使用-d cpu在CPU上运行极慢。检测结果与Web UI不一致确保命令行使用的模型路径 (model_dir) 和Web服务加载的是同一个。置信度阈值 (-c) 也会显著影响结果数量请与Web UI左侧的滑块设置保持一致对比。6. 总结通过这篇教程你已经将DAMO-YOLO从一个好玩的交互工具升级为了一个强大的自动化视觉分析引擎。我们来回顾一下关键收获核心价值命令行批量处理解决了海量图片分析中的效率瓶颈实现了处理过程的自动化与可集成化。关键工具我们创建了一个功能完整的Python脚本 (batch_damoyolo.py)它能够加载模型、遍历图片、执行检测、过滤结果并保存多种格式的输出。灵活使用通过命令行参数你可以轻松控制输入输出、检测灵敏度并选择保存文本或JSON格式的详细数据。无限可能这个脚本可以成为你自动化工作流的核心组件无论是定时分析监控画面、批量审核用户上传的图片还是为大型数据集自动生成标注它都能可靠地完成任务。从在酷炫的界面上点按拖拽到在命令行中运指如飞这不仅是操作方式的改变更是思维从“工具使用者”到“流程构建者”的跃迁。现在去用这几行命令高效地完成你的视觉任务吧。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关新闻

最新新闻

日新闻

周新闻

月新闻