最近的一項研究表明,醫生的頭腦通常是優秀的決策者,但即使是最聰明的醫生也可能從 ChatGPT 提供的診斷幫助中受益匪淺。
主要好處來自乙個被稱為“概率推理”的思維過程——知道某事會(或不會)發生的幾率。
人類在概率推理中掙扎,這是根據計算概率做出決定的做法,“波士頓貝絲以色列女執事醫療中心該研究的主要作者亞當羅德曼博士解釋說。
概率推理是診斷過程的幾個關鍵組成部分之一,這是乙個非常複雜的過程,涉及許多不同的認知策略,“他在貝斯以色列醫院發布的新聞稿中解釋說。 “我們選擇單獨評估概率推理,因為這是人類需要支援的眾所周知的領域。 ”
Beth Israel的團隊使用了之前發表的對550名醫療保健從業者的調查資料。 他們都被要求進行概率推理來診斷五個不同的病例。
然而,在這項新研究中,Rodham 的團隊為 ChatGPT 的大型語言模型 (LLM) ChatGPT-4 提供了相同的五個案例。
這些病例包括來自常規醫學檢查的資訊,例如肺炎胸部掃瞄、乳腺癌乳房 X 光檢查、冠狀動脈疾病運動試驗和尿路感染尿培養。
基於這些資訊,聊天機械人使用自己的概率推理來重新評估各種患者診斷的可能性。
在五種情況中的兩種情況下,聊天機械人比人類醫生更準確;有兩個和人類醫生一樣準確;還有乙個不太準確。 當研究人員將人類與聊天機械人進行比較進行醫療診斷時,他們認為這是一種“平局”。
然而,當患者的檢測結果為陰性(而不是陽性)時,ChatGPT-4 聊天機械人表現良好,在診斷準確性方面有五例超過了醫生。
人類有時認為陰性檢測結果風險更大,這可能導致過度檢測、增加檢測和過度吸毒,“美國貝絲以色列醫學系的內科醫生和研究員羅德曼指出。
該研究於12月11日發表在開放的線上期刊《美國醫學會雜誌》(JAMA)上。
研究人員表示,有朝一日,醫生可能會與人工智慧協同工作,這使得使患者診斷更加準確成為可能。
羅德曼稱這一前景“令人興奮”。
“雖然它們(聊天機械人)並不完美,但它們易於使用,可以整合到臨床工作流程中,理論上可以讓人類做出更好的決策,”他說。 未來,對人類集體智慧和人工智慧的研究是非常必要的。 ”
更多資訊。 想了解更多關於哈佛大學人工智慧和醫學的資訊嗎?
*:貝絲以色列女執事醫療中心新聞稿,2023 年 12 月 11 日。
版權所有 2023 Healthday。 保留所有權利。