醫(yī)學(xué)影像方向開源數(shù)據(jù)集資源匯總
瘧疾細(xì)胞圖像數(shù)據(jù)集
下載鏈接:http://suo.nz/2VQTUt
數(shù)據(jù)集包含 2 個(gè)文件夾
已感染
未感染
共 27,558 張圖像。

皮膚癌 MNIST:HAM10000
下載鏈接:http://suo.nz/33n6Xy
該數(shù)據(jù)集收集了來自不同人群的皮膚鏡圖像,通過不同的方式獲取和存儲(chǔ)。最終數(shù)據(jù)集包含 10015 張皮膚鏡圖像,可用作學(xué)術(shù)機(jī)器學(xué)習(xí)目的的訓(xùn)練集。案例包括色素病變領(lǐng)域所有重要診斷類別的代表性集合:光化性角化病和上皮內(nèi)癌/鮑溫氏病 (akiec)、基底細(xì)胞癌 (bcc),超過50%的病變是通過組織病理學(xué)(histo)證實(shí)的,其余病例的ground truth要么是后續(xù)檢查(follow_up),要么是專家共識(shí)(consensus),要么是活體共聚焦顯微鏡(confocal)證實(shí). 數(shù)據(jù)集包括具有多個(gè)圖像的病變,可以通過 HAM10000_metadata 文件中的 lesion_id 列進(jìn)行跟蹤。

乳房組織病理學(xué)圖像
下載鏈接:http://suo.nz/347Jt1
原始數(shù)據(jù)集包含以 40 倍掃描的 162 個(gè)完整的乳腺癌 (BCa) 標(biāo)本幻燈片圖像。從中提取了 277,524 個(gè)大小為 50 x 50 的補(bǔ)?。?98,738 個(gè) IDC 負(fù)值和 78,786 個(gè) IDC 正值)。每個(gè)補(bǔ)丁的文件名格式為:u_xX_yY_classC.png — > example 10253_idx5_x1351_y1101_class0.png。其中 u 是患者 ID (10253_idx5),X 是裁剪此補(bǔ)丁的 x 坐標(biāo),Y 是裁剪此補(bǔ)丁的 y 坐標(biāo),C 表示類,其中 0 是非 IDC 和1 是數(shù)據(jù)中心。

胸部 X 光圖像(肺炎)
下載鏈接:http://suo.nz/3aXYPg
數(shù)據(jù)集分為 3 個(gè)文件夾(train、test、val)并包含每個(gè)圖像類別(肺炎/正常)的子文件夾。有 5,863 張 X 射線圖像 (JPEG) 和 2 個(gè)類別(肺炎/正常)。胸部 X 光圖像(前后位)選自廣州市婦女兒童醫(yī)療中心 1 至 5 歲兒科患者的回顧性隊(duì)列。所有胸部 X 光成像都是作為患者常規(guī)臨床護(hù)理的一部分進(jìn)行的。
對(duì)于胸部 X 光圖像的分析,最初通過去除所有低質(zhì)量或不可讀的掃描來篩選所有胸部 X 光片以進(jìn)行質(zhì)量控制。圖像的診斷隨后由兩名專家醫(yī)師進(jìn)行分級(jí),然后才被批準(zhǔn)用于訓(xùn)練 AI 系統(tǒng)。為了解決任何評(píng)分錯(cuò)誤,評(píng)估集還由第三位專家進(jìn)行了檢查。

白內(nèi)障數(shù)據(jù)集
下載鏈接:http://suo.nz/2cOidH
用于白內(nèi)障檢測(cè)的白內(nèi)障和正常眼睛圖像數(shù)據(jù)集。
惡性與良性皮膚癌
下載鏈接:http://suo.nz/2kkvio
該數(shù)據(jù)集包含良性皮膚痣和惡性皮膚痣圖像的平衡數(shù)據(jù)集。數(shù)據(jù)由兩個(gè)文件夾組成,每個(gè)文件夾包含兩種痣的 1800 張圖片 (224x244)。