DescriptionDeepScores 数据集的目标是推进小物体识别的最新技术,并将物体识别问题置于场景理解的背景下。 DeepScores 包含高质量的乐谱图像,分为 300 0 000 张书面音乐,其中包含不同形状和大小的符号。拥有近一亿个小对象,这使得我们的数据集不仅独一无二,而且是最大的公共数据集。 DeepScores 带有用于对象分类、检测和语义分割的基本事实。因此,DeepSco
数据集介绍“野外 3D 姿势数据集”是野外第一个具有准确 3D 姿势用于评估的数据集。 虽然存在户外其他数据集,但它们都仅限于较小的记录量。 3DPW 是第一个包含从移动电话摄像头拍摄的视频片段的技术。数据集包括:60 个视频序列。2D 姿势注释。使用我们的方法获得的 3D 姿势。 我们的方法利用了视频和 IMU,尽管场景很复杂,但姿势非常准确。序列中每一帧的相机姿势。3D 身体扫描和 3D 人物
该数据集是CVPR2022论文"Towards Driving-Oriented Metric for Lane Detection Models"的数据集。为了在同一数据集上评估传统指标和以任务为中心的下游指标 E2E-LD 和 PSLD,需要用到车道线注释和驾驶信息(例如位置、转向角和速度)。 因此,我们创建了一个名为 Comma2k19-LD 的新数据集,我们在其中手动注释了 2,000 帧
该存储库包含两个语义分割的道路场景图像合成数据集,它们是作为 Cam2BEV 项目的一部分创建的。在该项目中,数据集收集了多个车载摄像头的图像,并被用于计算语义分割的鸟瞰图(BEV)图像。同时该数据集被arXiv论文"A Sim2Real Deep Learning Approach for the Transformation of Images from Multiple Vehicle-Mo
该数据集为自动驾驶车辆提供了易于使用的训练数据。 提供驾驶视频中每一帧对应的转向角、加速度、刹车和档位。 这段视频是使用安装在汽车挡风玻璃上的摄像头录制的,该汽车沿着印度喀拉拉邦的道路行驶。
StreetScenes Challenge Framework 是用于对象检测的图像、注释、软件和性能测量的集合。 每张图像都是从马萨诸塞州波士顿及其周边地区的 DSC-F717 相机拍摄的。 然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。 这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关
SVHN is a real-world image dataset for developing machine learning and object recognition algorithms with minimal requirement on data preprocessing and formatting. It can be seen as similar in flavor