電話:
021-67610176傳真:
導讀 | 5月28日,在ANNALS OF ONCOLOGY上發(fā)表的一項研究中,來自德、美、法三國的研究人員開發(fā)了一個深度學習卷積神經網絡(CNN),并通過展示10萬多幅惡性黑色素瘤和良性痣的圖像來讓它識別皮膚癌。而且,在CNN與58位皮膚科醫(yī)生的“PK賽”中, CNN比皮膚科醫(yī)生更少漏診黑素瘤,誤診良性黑素瘤的幾率更低。 |
這是科學家們表明, CNN作為人工智能或機器學習形式比有經驗的皮膚科醫(yī)生更能準確診斷皮膚癌。
關于CNN
CNN是一種人工神經網絡,它的研發(fā)靈感來源于大腦中神經元相互連接并對眼睛看到的東西做出反應的啟發(fā)。CNN能夠從它“看到”的圖像中快速學習,并從它所學的知識中自學提高其性能,這一過程也稱為機器學習。
這項研究的*作者,德國海德堡大學皮膚科醫(yī)師Holger Haenssle教授解釋說:“CNN的工作原理就像一個孩子的大腦。為了訓練它,我們向CNN展示了10萬多幅惡性和良性皮膚癌和黑痣的圖像,并指出每幅圖像的診斷。CNN通過每一幅圖像的訓練提高了區(qū)分良惡性病變的能力。”
“培訓結束后,我們從海德堡圖書館創(chuàng)建了兩套未被用于培訓的測試圖像(CNN對此一無所知)。接著建立一組300幅圖像來單獨測試CNN的性能。在此之前,選擇了100個zui困難的病變來測試真正的皮膚科醫(yī)生,并與CNN的結果進行比較。”
圖片來源:conceptsrise.com
CNN對戰(zhàn)皮膚科醫(yī)生
來自世界17個國家的58位皮膚科醫(yī)生受邀參加了這項“對決”。其中17人(29 %)表示他們在皮膚鏡檢查方面的經驗不足兩年,11人(19 %)表示他們擁有2至5年的經驗,30人(52 %)表示他們擁有5年以上的經驗。
首先,皮膚科醫(yī)生被要求從皮膚鏡圖像(I級)診斷惡性黑色素瘤或良性痣,并給出治療對策(手術、短期隨訪或不需要采取行動)。然后,四周后,他們會得到關于患者的臨床信息(包括年齡、性別和病變位置)和相同100例(II級)的特寫圖像,并再次要求診斷和治療決策。
在I級測試中,皮膚科醫(yī)生平均準確檢測到86.6 %的黑色素瘤,并且正確地識別出平均71.3 %的非惡性病變。然而,當CNN調節(jié)到與醫(yī)生相同的水平時,可檢測到95 %的黑色素瘤。在II級測試中,皮膚科醫(yī)生改善了他們的表現(xiàn),準確診斷出88.9 %的惡性黑色素瘤和75.7 %的非惡性病變。
盡管當皮膚科醫(yī)生在II級獲得更多臨床資料和圖像時,他們的診斷性能得到了提高。然而,與此同時CNN仍在努力超越醫(yī)生的診斷能力。另一方面,專家皮膚科醫(yī)生在I級表現(xiàn)比經驗較少的皮膚科醫(yī)生更好,并且在惡性黑色素瘤的檢測方面更好。然而,他們平均作出正確診斷的能力仍然比CNN要差。
Melanoma in skin biopsy with H&E stain — this case may represent superficial spreading melanoma. Credit: Wikipedia/CC BY-SA 3.0
CNN未來運用方向
惡性黑素瘤的發(fā)病率正在增加,估計*有23.2萬個新病例,每年約有55 500人死于這種疾病。如果及早發(fā)現(xiàn),這種病是可以治愈的,但許多病例確診時已經進入癌癥后期。
Haenssle教授說:“近20年來,我一直致力于改善黑色素瘤早期檢測的研究項目。我和我的團隊專注于無創(chuàng)技術,例如,在進行皮膚癌篩查時,這些技術可以幫助醫(yī)生避免錯過黑色素瘤。而當我看到zui近關于深度學習算法在特定任務中優(yōu)于人類專家的報告時,我立刻知道我們必須探索人工智能算法來診斷黑色素瘤。”
“CNN診斷遺漏的黑色素瘤較少,這意味著它比皮膚科醫(yī)生更敏感;它誤診為惡性黑色素瘤的良性痣較少,這意味著它具有更高的特異性;這些發(fā)現(xiàn)將減少不必要的手術。”
需要指出的是,研究人員并不認為CNN會取代皮膚科醫(yī)生診斷皮膚癌,但它可以作為一種額外的輔助手段。
“CNN可以幫助參與皮膚癌篩查的醫(yī)生決定是否對病灶進行活檢。大多數(shù)皮膚科醫(yī)生已經使用數(shù)字皮膚鏡系統(tǒng)對病變進行成像和存儲,以便記錄和隨訪。然后,CNN可以簡易快速地評估存儲的圖像,以獲得關于黑色素瘤概率的‘專家意見’。我們目前正在計劃前瞻性研究,以評估CNN對醫(yī)生和患者的現(xiàn)實影響。”
一些局限性
這項研究有一些局限性,包括皮膚科醫(yī)生是處于一個人工環(huán)境中,他們知道自己并不是在作“生死”的決定;測試集不包括全部皮膚損傷;非白種人皮膚類型和遺傳背景的有效圖像較少等。
他們還強調,在AI成為臨床標準之前需要解決的一些問題還包括難以在手指、腳趾和頭皮等部位成像一些黑色素瘤,以及如何訓練AI充分識別非典型黑色素瘤和醫(yī)學尚且未知的黑色素瘤等。
“目前,沒有什么可以替代*的臨床檢查。但2 - D和3 - D全身影像已經能夠捕獲約90 %至95 %的皮膚表面,且鑒于成像技術的指數(shù)發(fā)展,我們設想自動診斷遲早將改變皮膚病學的診斷范式。然而,在將這一技術安全應用到常規(guī)臨床護理前,還有許多工作要做。”作者們總結說。
參考資料:
Man against machine: AI is better than dermatologists at diagnosing skin cancer