Description加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成,该视频取自在城市环境中通过常规交通行驶的车辆。 注释了大约 250,000 帧(在 137 个大约分钟长的片段中),总共 350,000 个边界框和 2300 个独特的行人。 注释包括边界框和详细的遮挡标签之间的时间对应关系ReferencesP. Dollár, C. Wojek, B. Sc
Description
References
P. Dollár, C. Wojek, B. Schiele and P. Perona
Pedestrian Detection: An Evaluation of the State of the Art
P. Dollár, C. Wojek, B. Schiele and P. Perona
Pedestrian Detection: A Benchmark
CVPR 2009, Miami, Florida. [pdf|bibtex]
作为行人检测中最常用的数据集之一,网上关于该数据集的相关使用的详解并不是很多,结合自己目前的相关工作,对其进行一个系统的梳理,给后面又需要的小伙伴。 Caltech Pedestrian Detection Benchmark一、数据集…
文章目录Caltech Pedestrian Detection 数据集预处理一、Caltech 数据集简介参考资料Caltech Pedestrian Detection 数据集预处理一、Caltech 数据集简介官网: Image_Datasets/CaltechPedestrians/Description(Overview):The Caltech Pedestrian Dataset consists of approxim
1、Caltech Pedestrian Detection Benchmark Image_Datasets/CaltechPedestrians/ 加州理工学院行人数据集包含大约10个小时的640x480 30Hz视频,这些视频是通过在城市环境中正常行驶的车辆拍摄的。大约250,000帧(137分钟左右),共计350,000个...
UCSD Pedestrian 数据集包含 UCSD 加州大学圣地亚哥分校的行人录像视频,所有视频文件皆由两个观测点摄像头所拍摄,视频规格压缩为 238×158 10fps
加州理工学院行人检测基准 描述 加州理工学院行人数据集包括大约10小时的640x480 30Hz视频,这些视频来自在城市环境中通过常规交通的车辆。大约250,000个框架(137个近似分钟的长段)
行人检测具有极其广泛的应用:智能辅助驾驶,智能监控,行人分析以及智能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段,但是也存在很多问题还有待解决,主要还是在性能和速度方面还不能达到一个权衡。近年,以谷歌为首的自动驾驶技术的研发正如火如荼的进行,这也迫切需要能对行人进行快速有效的检测,以保证自动驾驶期间对行人的安全不会产生威胁。
1 行人检测的现状
大概可以分为两类
1.1 基于背景建模
利用背景建模方法,提取出前景运动的目标,在目标区域内进行特征提取,然后利用分类器进行分类,判断是否包含行人;背景建模目前主要存在的问题:
1)必须适应环境的变化(比如光照的变化造成图像色度的变化);
2)相机抖动引起画面的抖动(比如手持相机拍照时候的移动);
3)图像中密集出现的物体(比如树叶或树干等密集出现的物体,要正确的检测出来);
4)必须能够正确的检测出背景物体的改变(比如新停下的车必须及时的归为背景物体,而有静止开始移动的物体也需要及时的检测出来)。
5)物体检测中往往会出现Ghost区域,Ghost区域也就是指当一个原本静止的物体开始运动,背静差检测算法可能会将原来该物体所覆盖的区域错误的检测为运动的,这块区域就成为Ghost,当然原来运动的物体变为静止的也会引入Ghost区域,Ghost区域在检测中必须被尽快的消除。
1.2 基于统计学习的方法
这也是目前行人检测最常用的方法,根据大量的样本构建行人检测分类器。提取的特征主要有目标的灰度、边缘、纹理、颜色、梯度直方图等信息。分类器主要包括神经网络、SVM、adaboost以及现在被计算机视觉视为宠儿的深度学习。
统计学习目前存在的难点:
1)行人的姿态、服饰各不相同、复杂的背景、不同的行人尺度以及不同的光照环境。
2)提取的特征在特征空间中的分布不够紧凑;
3)分类器的性能受训练样本的影响较大;
4)离线训练时的负样本无法涵盖所有真实应用场景的情况;
目前的行人检测基本上都是基于法国研究人员Dalal在2005的CVPR发表的HOG+SVM的行人检测算法(Histograms of Oriented Gradients for Human Detection, Navneet Dalel,Bill Triggs, CVPR2005)。HOG+SVM作为经典算法也集成到opencv里面去了,可以直接调用实现行人检测
为了解决速度问题可以采用背景差分法的统计学习行人检测,前提是背景建模的方法足够有效(即效果好速度快),目前获得比较好的检测效果的方法通常采用多特征融合的方法以及级联分类器。(常用的特征有Harry-like、Hog特征、LBP特征、Edgelet特征、CSS特征、COV特征、积分通道特征以及CENTRIST特征)。
数据集介绍: 由于具有强大的三维信息捕捉能力,光场数据为显著性检测算法提供了更为有力的支持。但算法的能力取决于数据集构建的全面性、有效性、规模化和多样性,同时也取决于灵活高效的模型设计。为了促进这一领域的发展,来自大连理工的研究人员构建了大规模的多功能数据集,其中包含了102类目标、共4202个样本,可以有效支持基于RGB、RGB-D和光场数据的显著性检测算法。
该数据集由 Carla 驾驶模拟器生成的图像组成。 训练图像是由安装在模拟车辆中的行车记录仪捕获的图像。 标签图像是分割掩码。 标签图像将每个像素分类为:左侧车道边界的和右侧车道边界。与该数据集相关的挑战是训练一个能够准确预测验证数据集的分割掩码的模型。
m2caiSeg是根据真实世界外科手术的内窥镜视频源创建的。数据由 307 张图像组成,每张图像都针对场景中存在的器官和不同的手术器械进行了注释。 If you use this dataset in your work, kindly do cite our paper: @article{maqbool2020m2caiseg, title={m2caiSeg: Semantic Se
本数据集包含23类皮肤病的图像数据,图像总数约为 19,500 张,其中大约 15,500 张已在训练集中分割,其余在测试集中分割。 Acknowledgements The images are taken from the public portal Dermnet (http://www.dermnet.com/) which is the largest dermatology sou