通用物体检测模型

简介

该模块使用通用物体检测模型对图像或视频帧中的物体进行检测和识别,支持详细的物体类别分类检测如手机,男人,女人,轿车,卡车等。 用户可以通过提示词自定义检测类别,实现更灵活的检测需求。

备注

该模块适用于详细物体类别分类的检测场景,需要求较高的资源占用,如果只是进行简单的物体检测,建议使用更轻量级的通用检测模型(快)。

输入/输出

  • 输入:图像 (来自上游节点或工作流输入)

  • 输出:基于用户提示词的检测结果,包含检测到的物体类别、置信度和边界框信息。

场景示例

输入: ``["male,female"] ``

工作流示例:

配置参数详解

参数

说明

示例/ 默认值

节点名称

自定义该节点的名称,用于标识工作流中的该步骤。无需特意编辑,保持默认即可。

general_object_detection_1

备注

可选的备注信息,用于描述该步骤的用途。

留空

图像

指定输入图像的来源,可以是上游节点的输出或工作流的输入参数。

input image

检测分类

自定义检测类别的英文提示词,在 ["  "] 中输入需要检测的物体类别,多个类别用逗号分隔。

["person", "car", "bicycle"]

置信度阈值

设置检测结果的置信度阈值,范围为0到1。低于该阈值的检测结果将被过滤掉。

0.3

标签置信度阈值

为每个标签单独设置置信度阈值,使用JSON格式输入。

{"car": 0.5, "person": 0.7}

最大检测数量

设置每张图像中最多检测出的物体数量,超过该数量的检测结果将被忽略。

100

使用场景

  • 需要对图像或视频中的特定物体类别进行检测和识别。

  • 需要收集特定类别物体的信息为DaoAi World模型数据集提供训练数据。

  • 视频和目标场景中没有特别要求实时处理速度,允许使用较高资源占用的模型。