加州理工学院行人检测数据集

订阅方案：

普通用户：

￥30.00

VIP用户：

￥0.00

联系客服查看订阅方案

所属分类：综合数据标签：（无）

来源： Moonapi

更新时间： 2024-05-08 最新数据时间：自动更新

数据集简介：

Description加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成，该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧（在 137 个大约分钟长的片段中），总共 350,000 个边界框和 2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系ReferencesP. Dollár, C. Wojek, B. Sc

展开

质量保证
免费样本数据
免费数据更新
提供发票

数据集概览(文件数量，文件种类，数据集行列数)，数据集示例数据请查看下方数据集介绍或联系客服索取

数据集介绍
订阅方案
问题反馈

加州理工学院行人检测数据集简介

Description

加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成，该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧（在 137 个大约分钟长的片段中），总共 350,000 个边界框和 2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系

References

P. Dollár, C. Wojek, B. Schiele and P. Perona

Pedestrian Detection: An Evaluation of the State of the Art

PAMI, 2012. [pdf|bibtex].

P. Dollár, C. Wojek, B. Schiele and P. Perona

Pedestrian Detection: A Benchmark

CVPR 2009, Miami, Florida. [pdf|bibtex]

作为行人检测中最常用的数据集之一，网上关于该数据集的相关使用的详解并不是很多，结合自己目前的相关工作，对其进行一个系统的梳理，给后面又需要的小伙伴。 Caltech Pedestrian Detection Benchmark一、数据集…

文章目录Caltech Pedestrian Detection 数据集预处理一、Caltech 数据集简介参考资料Caltech Pedestrian Detection 数据集预处理一、Caltech 数据集简介官网： Image_Datasets/CaltechPedestrians/Description（Overview）：The Caltech Pedestrian Dataset consists of approxim

1、Caltech Pedestrian Detection Benchmark Image_Datasets/CaltechPedestrians/ 加州理工学院行人数据集包含大约10个小时的640x480 30Hz视频，这些视频是通过在城市环境中正常行驶的车辆拍摄的。大约250,000帧（137分钟左右），共计350,000个...

UCSD Pedestrian 数据集包含 UCSD 加州大学圣地亚哥分校的行人录像视频，所有视频文件皆由两个观测点摄像头所拍摄，视频规格压缩为 238×158 10fps

加州理工学院行人检测基准描述加州理工学院行人数据集包括大约10小时的640x480 30Hz视频，这些视频来自在城市环境中通过常规交通的车辆。大约250,000个框架（137个近似分钟的长段）

  行人检测具有极其广泛的应用：智能辅助驾驶，智能监控，行人分析以及智能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段，但是也存在很多问题还有待解决，主要还是在性能和速度方面还不能达到一个权衡。近年，以谷歌为首的自动驾驶技术的研发正如火如荼的进行，这也迫切需要能对行人进行快速有效的检测，以保证自动驾驶期间对行人的安全不会产生威胁。

1 行人检测的现状

大概可以分为两类

1.1    基于背景建模

利用背景建模方法，提取出前景运动的目标，在目标区域内进行特征提取，然后利用分类器进行分类，判断是否包含行人；背景建模目前主要存在的问题：

1）必须适应环境的变化（比如光照的变化造成图像色度的变化）；

2）相机抖动引起画面的抖动(比如手持相机拍照时候的移动)；

3）图像中密集出现的物体（比如树叶或树干等密集出现的物体，要正确的检测出来）；

4）必须能够正确的检测出背景物体的改变（比如新停下的车必须及时的归为背景物体，而有静止开始移动的物体也需要及时的检测出来）。

5）物体检测中往往会出现Ghost区域，Ghost区域也就是指当一个原本静止的物体开始运动，背静差检测算法可能会将原来该物体所覆盖的区域错误的检测为运动的，这块区域就成为Ghost，当然原来运动的物体变为静止的也会引入Ghost区域，Ghost区域在检测中必须被尽快的消除。

1.2    基于统计学习的方法

这也是目前行人检测最常用的方法，根据大量的样本构建行人检测分类器。提取的特征主要有目标的灰度、边缘、纹理、颜色、梯度直方图等信息。分类器主要包括神经网络、SVM、adaboost以及现在被计算机视觉视为宠儿的深度学习。

统计学习目前存在的难点：

1）行人的姿态、服饰各不相同、复杂的背景、不同的行人尺度以及不同的光照环境。

2）提取的特征在特征空间中的分布不够紧凑；

3）分类器的性能受训练样本的影响较大；

4）离线训练时的负样本无法涵盖所有真实应用场景的情况；

   目前的行人检测基本上都是基于法国研究人员Dalal在2005的CVPR发表的HOG+SVM的行人检测算法(Histograms of Oriented Gradients for Human Detection, Navneet Dalel,Bill Triggs, CVPR2005)。HOG+SVM作为经典算法也集成到opencv里面去了，可以直接调用实现行人检测

为了解决速度问题可以采用背景差分法的统计学习行人检测，前提是背景建模的方法足够有效（即效果好速度快），目前获得比较好的检测效果的方法通常采用多特征融合的方法以及级联分类器。（常用的特征有Harry-like、Hog特征、LBP特征、Edgelet特征、CSS特征、COV特征、积分通道特征以及CENTRIST特征）。