StreetScenes Challenge Framework 是用于对象检测的图像、注释、软件和性能测量的集合。 每张图像都是从马萨诸塞州波士顿及其周边地区的 DSC-F717 相机拍摄的。 然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。 这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关
该数据集包含 2D 深度图像,如下图所示。像 KITTI 数据集中的 360 度 LiDAR 框架在传感器本身周围呈圆柱形。该数据集中的 2D 深度图像可以表示为您在 LiDAR 框架的圆柱体上进行了切割并将其拉直以位于 2D 平面中。这些 2D 深度图像的像素代表反射物体与 LiDAR 传感器的距离。 2D 深度图像的垂直分辨率(在我们的例子中为 64)表示用于扫描周围环境的 LiDAR 传感器
该数据集由 Carla 驾驶模拟器生成的图像组成。 训练图像是由安装在模拟车辆中的行车记录仪捕获的图像。 标签图像是分割掩码。 标签图像将每个像素分类为:左侧车道边界的和右侧车道边界。与该数据集相关的挑战是训练一个能够准确预测验证数据集的分割掩码的模型。
本数据集来自于AIM 2022 压缩图像和视频超分辨率挑战赛”中的前 5 名解决方案工作:Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and Restoration Please check our project SWIN2SR https://github.com/mv-lab/swin2sr ???? ????
CamSeq是一个地面数据集,可自由用于视频目标识别中的研究工作。该数据集包含 101 个 960x720 像素的图像对。 每个掩码都由文件名之外的“_L”指定。 所有图像(原始图像和真实图像)均为未压缩的 24 位彩色 PNG 格式。 该数据集最初是针对自动驾驶汽车的问题而设计的。此序列描绘了从一辆动感的汽车拍摄的剑桥市的动感驾驶场景。这是一个具有挑战性的数据集,因为除了汽车的自我运动之外,其他
该数据集已特别针对非洲地区进行了改进。 两个开源数据集仅用于提取非洲地区使用的交通标志。该数据集包含来自所有类别的 76 个类,例如 监管、警告、指南和信息标志。 该数据集总共包含 19,346 张图像和每个类别至少 200 个实例。