PatchCamelyon 是一个新的且具有挑战性的图像分类数据集。它由从淋巴结切片的组织病理学扫描中提取的 327.680 张彩色图像 (96 x 96px) 组成。每个图像都带有一个二进制标签,表示存在转移组织。PCam 为机器学习模型提供了新的基准:大于 CIFAR10,小于 imagenet,可在单个 GPU 上训练。 Usage and Tips Keras Example Gene
PatchCamelyon 是一个新的且具有挑战性的图像分类数据集。它由从淋巴结切片的组织病理学扫描中提取的 327.680 张彩色图像 (96 x 96px) 组成。每个图像都带有一个二进制标签,表示存在转移组织。PCam 为机器学习模型提供了新的基准:大于 CIFAR10,小于 imagenet,可在单个 GPU 上训练。
from keras.utils import HDF5Matrix from keras.preprocessing.image import ImageDataGenerator x_train = HDF5Matrix('camelyonpatch_level_2_split_train_x.h5', 'x') y_train = HDF5Matrix('camelyonpatch_level_2_split_train_y.h5', 'y') datagen = ImageDataGenerator( preprocessing_function=lambda x: x/255., width_shift_range=4, # randomly shift images horizontally height_shift_range=4, # randomly shift images vertically horizontal_flip=True, # randomly flip images vertical_flip=True) # randomly flip images model.fit_generator(datagen.flow(x_train, y_train, batch_size=batch_size), steps_per_epoch=len(x_train) // batch_size epochs=1024,
)
If you use PCam in a scientific publication, we would appreciate references to the following paper:
[1] B. S. Veeling, J. Linmans, J. Winkens, T. Cohen, M. Welling. "Rotation Equivariant CNNs for Digital Pathology". arXiv:1806.03962
A citation of the original Camelyon16 dataset paper is appreciated as well:
[2] Ehteshami Bejnordi et al. Diagnostic Assessment of Deep Learning Algorithms for Detection of Lymph Node Metastases in Women With Breast Cancer. JAMA: The Journal of the American Medical Association, 318(22), 2199–2210. doi:jama.2017.14585
Biblatex entry:
@ARTICLE{Veeling2018-qh,
title = "Rotation Equivariant {CNNs} for Digital Pathology",
author = "Veeling, Bastiaan S and Linmans, Jasper and Winkens, Jim and
Cohen, Taco and Welling, Max",
month = jun,
year = 2018,
archivePrefix = "arXiv",
primaryClass = "cs.CV",
eprint = "1806.03962" }
介绍目的:识别淋巴结病理切片有无癌细胞数据:Histopathologic Cancer Detection(鉴别淋巴结病理切片有无癌细胞),为图像二分类数据集 (图片大小 96 imes96 imes3),来自 Kaggle,可下载;为减少运算时间,仅…
撰文 | 伊凯 责编 | 兮 由病理学专家对来源于患者的组织切片进行显微镜辅助观察与分析,通过寻找和标注切片中的异常区域对疾病进展和分类作出判断(即病理诊断),是包括癌症在内的各类疾病诊断的重要过程。近年来…
病理切片是取一定大小的病变组织,用病理组织学方法制成病理切片〔通常将病变组织包埋在石蜡块里,用切片机切成薄片,再用苏木精-伊红(H-E)染色〕,用显微镜进一步检查病变。病变的发生发展过程,最后作出病理诊断。
N分期是预后评估和基于分期的癌症治疗策略决策的决定性因素。目视检查完整淋巴结的整个切片是目前病理学家计算转移淋巴结(MLNs)数量的主要方法,即使在同一个N期,...
背景介绍深度学习在医学图像处理上已经被广泛应用,今天小编为大家带来的这篇文章,作者提出了一个深度学习框架,通过分析胃癌(GC)的淋巴结全视野数字切片(WSI),来识别淋巴结(LN)和肿瘤区域,并提出了…
外皮质区是皮质区外周的狭窄带状区,紧贴包膜下窦,是淋巴滤泡所在区,主要由T小淋巴细胞组成,内有少许浆细胞及少数毛细胞血管后静脉。淋巴窦是淋巴结主要病原体和异物之过滤器,淋巴细胞可进入淋巴窦,而浆细胞一般不见于…
组织病理学癌症检测
一、题目理解
Histopathologic Cancer Detection需要识别从较大的数字病理扫描中获取的小图像补片中的转移性癌症。此竞赛的数据是PatchCamelyon(PCam)基准数据集的略微修改版本(原始PCam数据集由于其概率抽样而包含重复图像,但是,在Kaggle上呈现的版本不包含重复项)。PCam数据集将临床相关的转移检测任务打包成为,二分类任务,类似于CIFAR-10和MNIST。模型可以在几个小时内在单个GPU上轻松训练,并在Camelyon16肿瘤检测和整个幻灯片图像诊断任务中获得竞争分数。此外,任务难度和易处理性之间的较为平衡,可以学习研究基础机器学习模型不确定性和可解释性。
这是一个二值分类问题,需要确认96x96大小的图片中是否存在癌细胞,但是对于阳性样本(癌细胞样本)的标记是根据图片中心的32x32大小区域中的切片情况。所以可能需要我们对图片进行剪裁,去除标记中心外围的干扰。
数据集由两组序列组成。 这些序列被命名为白天和夜晚集,指的是它们被获取的一天中的时刻,Visible和 FIR 取决于用户记录序列的相机。 白天训练 3695 个 imegas,晚上训练 3390 个图像,每个序列大约有 1500 个强制性行人注释。 用于测试两个序列的约 700 张图像,白天约有 2000 名行人,夜间约有 1500 名行人。
该数据集是与学术项目协调使用的公共推特更新的集合,用于研究与推特相关的地理定位数据。训练集包含 115,886 个 Twitter 用户和来自用户的 3,844,612 个更新。用户的所有位置都在美国以城市级粒度进行自我标记。测试集包含 5,136 个 Twitter 用户和来自用户的 5,156,047 条推文。用户的所有位置都是从他们的智能手机以“UT:纬度,经度”的形式上传的。 Plea
在这个数据集中有 90 个不同类别的 5400 张动物图像。此数据集是从 Google 图片创建的:https://images.google.com/。所有照片将按照其所属类别存放于各自的文件夹下。动物类别包括:羚羊,獾,蝙蝠,熊,蜜蜂,甲虫,野牛,公猪,蝴蝶,猫毛虫,黑猩猩等。该数据集中的图像大小不固定,可能需要后续的处理。
数据集介绍: 由于具有强大的三维信息捕捉能力,光场数据为显著性检测算法提供了更为有力的支持。但算法的能力取决于数据集构建的全面性、有效性、规模化和多样性,同时也取决于灵活高效的模型设计。为了促进这一领域的发展,来自大连理工的研究人员构建了大规模的多功能数据集,其中包含了102类目标、共4202个样本,可以有效支持基于RGB、RGB-D和光场数据的显著性检测算法。