2月6日,兩項(xiàng)發(fā)表于《自然-健康》的研究表明,成本低廉的大語言模型(LLM)能夠在醫(yī)療資源有限的地區(qū)提高診斷成功率。在盧旺達(dá)和巴基斯坦的衛(wèi)生保健環(huán)境中,其表現(xiàn)甚至超過了訓(xùn)練有素的臨床醫(yī)生。

大語言模型有望改變醫(yī)療資源匱乏地區(qū)的現(xiàn)狀。圖片來源:Guerchom Ndebo
在盧旺達(dá),聊天機(jī)器人在各項(xiàng)評估指標(biāo)上的得分均超過當(dāng)?shù)嘏R床醫(yī)生;而在巴基斯坦,使用LLM輔助診斷的醫(yī)生平均診斷推理得分為71,而使用傳統(tǒng)資源的醫(yī)生得分為43。
“這些論文凸顯了LLM可助力中低收入國家臨床醫(yī)生提高護(hù)理水平?!庇=虼髮W(xué)人工智能(AI)倫理研究所的Caroline Green說。
在醫(yī)學(xué)領(lǐng)域,LLM不僅能通過醫(yī)學(xué)研究生的水平考試,還能幫助臨床醫(yī)生進(jìn)行診斷。不過,這些均為受控基準(zhǔn)測試中的表現(xiàn)。那么,在無法核對答案、患者眾多且資源有限的真實(shí)環(huán)境中,LLM表現(xiàn)究竟如何呢?為找到答案,兩個(gè)獨(dú)立研究團(tuán)隊(duì)分別在盧旺達(dá)與巴基斯坦進(jìn)行了研究。
在盧旺達(dá),研究人員測試了LLM能否在4個(gè)衛(wèi)生資源匱乏地區(qū)為患者提供準(zhǔn)確的臨床信息?!斑@些地區(qū)面臨醫(yī)護(hù)人員短缺問題,無法接診全部患者,多數(shù)患者由培訓(xùn)不足的社區(qū)工作者來接診和分診。”該研究作者、非營利性國際健康組織PATH的首席AI官Bilal Mateen說。
Mateen團(tuán)隊(duì)讓當(dāng)?shù)丶s100名社區(qū)衛(wèi)生工作者編制了一份包含5600個(gè)臨床問題的清單,均為患者最常提出的問題。研究人員將5個(gè)LLM對其中約500個(gè)問題的回答,與經(jīng)過培訓(xùn)的當(dāng)?shù)嘏R床醫(yī)生的回答進(jìn)行了對比。結(jié)果顯示,在11個(gè)評價(jià)指標(biāo)上,所有LLM的表現(xiàn)均優(yōu)于當(dāng)?shù)蒯t(yī)生。此外,LLM還可使用盧旺達(dá)語回答約100個(gè)問題。
Mateen表示,與人類相比,LLM還有另一個(gè)優(yōu)勢——可全天候接受社區(qū)健康工作者的咨詢。此外,LLM成本低廉——醫(yī)生的費(fèi)用為5.43美元、護(hù)士為3.80美元,而LLM用英語回答的成本為0.0035美元、用盧旺達(dá)語回答的成本為0.0044美元。
但美國貝斯以色列女執(zhí)事醫(yī)療中心的臨床和AI研究員Adam Rodman對將LLM與人類表現(xiàn)進(jìn)行比較持懷疑態(tài)度,認(rèn)為基于書面答案的評估機(jī)制更適合衡量模型性能,對人類表現(xiàn)則不那么有效。
在巴基斯坦,由拉合爾管理科學(xué)大學(xué)的計(jì)算機(jī)科學(xué)家Ihsan Qazi領(lǐng)導(dǎo)的研究團(tuán)隊(duì),對LLM在真實(shí)環(huán)境中的應(yīng)用進(jìn)行了研究。結(jié)果發(fā)現(xiàn),在缺乏醫(yī)學(xué)專家、患者數(shù)量龐大、診斷錯(cuò)誤率高的巴基斯坦,LLM可以提高診斷準(zhǔn)確性。
Qazi團(tuán)隊(duì)進(jìn)行了一項(xiàng)隨機(jī)對照試驗(yàn)——58名執(zhí)業(yè)醫(yī)師接受了20小時(shí)培訓(xùn),學(xué)習(xí)如何使用LLM來輔助診斷患者癥狀,并警惕程序可能出現(xiàn)的錯(cuò)誤或“幻覺”。結(jié)果表明,在審查臨床病例時(shí),訪問GPT-4o LLM的醫(yī)生的診斷準(zhǔn)確性評分顯著高于僅使用生物醫(yī)學(xué)數(shù)據(jù)庫PubMed和互聯(lián)網(wǎng)的醫(yī)生。
分析發(fā)現(xiàn),LLM得分甚至高于由其輔助的醫(yī)生,但也存在例外——在31%的病例中,醫(yī)生表現(xiàn)優(yōu)于AI的中位數(shù)表現(xiàn)。“這些病例多涉及臨床警示特征、背景因素,而這正是LLM所遺漏的。”Qazi說。
Qazi預(yù)計(jì),上述研究結(jié)果也適用于其他國家,但仍需使用不同模型開展重復(fù)驗(yàn)證。
Green提醒,LLM存在偏見和患者數(shù)據(jù)保密性問題,需高度警惕,絕不能采納由LLM提供的片面醫(yī)療保健理念。Qazi則警告,對AI的依賴可能導(dǎo)致醫(yī)生不加質(zhì)疑地接受有缺陷的答案,如研究中發(fā)現(xiàn)的遺漏臨床警示特征、背景因素等案例。(徐銳)
近日,市場監(jiān)管總局(國家標(biāo)準(zhǔn)委)批準(zhǔn)發(fā)布《中醫(yī)體質(zhì)分類與判定》推薦性國家標(biāo)準(zhǔn)。
聚集相關(guān)企業(yè)300余家,機(jī)器人產(chǎn)業(yè)鏈規(guī)模超百億元……北京亦莊,為何扎堆這么多機(jī)器人企業(yè)?
“十四五”時(shí)期,我國全社會(huì)研發(fā)經(jīng)費(fèi)投入年均增長10%,研發(fā)經(jīng)費(fèi)投入強(qiáng)度提高0.44個(gè)百分點(diǎn)。
日前,我科研團(tuán)隊(duì)在國際學(xué)術(shù)期刊《科學(xué)》發(fā)表論文《多尺度泛基因組圖譜賦能混合倍性甘蔗的基因組解析》,為甘蔗高產(chǎn)優(yōu)質(zhì)育種提供了全新“基因資源地圖”與核心分析工具。
日前,南海區(qū)域海-氣雙向耦合智能大模型“飛魚-1.0”在廣東廣州正式發(fā)布?!?/p>
這聲呼喚,穿越漫長歲月,凝結(jié)著人類對這位地球近鄰永恒的好奇與夢想。而今,隨著新一輪探月熱潮在全球興起,這句“去月球”已不再僅僅是浪漫的詩意表達(dá),更成為科技前沿競相追逐、國家實(shí)力與創(chuàng)新精神交匯的生動(dòng)實(shí)踐。
特種機(jī)器人技術(shù)與數(shù)智系統(tǒng)創(chuàng)新團(tuán)隊(duì)成員張平點(diǎn)擊一鍵啟動(dòng)指令后,雷達(dá)驅(qū)動(dòng)、定位算法、規(guī)劃與控制算法等模塊被加載。在系統(tǒng)支持下,無人機(jī)能夠精準(zhǔn)定位、自主導(dǎo)航與實(shí)時(shí)避障,像一位不知疲倦的巡檢員。
深耕西南高原山區(qū)二十余載,于富強(qiáng)與真菌為伴,在種質(zhì)資源保護(hù)與產(chǎn)業(yè)富民之間架起橋梁,把論文寫進(jìn)泥土中,把科研做進(jìn)農(nóng)戶的大棚里。3年間,于富強(qiáng)往返昆明與水城數(shù)十趟,硬是幫著水城從零起步,建成了食用菌研究所、日產(chǎn)50萬袋的菌種廠和鮮菇冷鏈物流集散中心。
研究團(tuán)隊(duì)將這一環(huán)境效應(yīng)與黑洞雙星軌道偏心率的演化同時(shí)納入統(tǒng)一模型,并將理論預(yù)測與北美納赫茲引力波天文臺(tái)合作組15年的觀測數(shù)據(jù)進(jìn)行對比分析。陳一帆表示,盡管當(dāng)前的不確定性仍然較大,但該研究已經(jīng)表明,引力波觀測開始攜帶關(guān)于星系中心環(huán)境的可測信息。
近日,國家管網(wǎng)集團(tuán)西部管道公司成功完成所轄新疆段天然氣、原油、成品油管道輸送全生命周期碳足跡核算,獲得中國質(zhì)量認(rèn)證中心頒發(fā)的“產(chǎn)品碳足跡證書”。
近日,中國農(nóng)業(yè)科學(xué)院蔬菜花卉研究所蔬菜分子設(shè)計(jì)育種創(chuàng)新團(tuán)隊(duì)研發(fā)出新型植物基因研究工具——對目標(biāo)DNA序列的鄰近空間蛋白標(biāo)記系統(tǒng)。
因?yàn)橄窳私庾约旱暮⒆右粯恿私夂谕恋?,韓曉增有個(gè)外號(hào)——“黑土地的營養(yǎng)搭配師”。他帶領(lǐng)團(tuán)隊(duì)精心配制出一套營養(yǎng)搭配的“秘方”。
蚊種與病毒之間存在高度匹配關(guān)系。1901年,公共衛(wèi)生與熱帶醫(yī)學(xué)領(lǐng)域先驅(qū)沃爾特·里德證明,蚊子是傳播黃熱病的元兇??茖W(xué)界傳統(tǒng)觀點(diǎn)認(rèn)為,病毒以顆粒形式在蚊子體內(nèi)傳播,卻始終不知道真正的“病毒受體”是什么。
科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新的深度融合,不僅是構(gòu)建現(xiàn)代化產(chǎn)業(yè)體系的戰(zhàn)略舉措,更是貫徹新發(fā)展理念、推動(dòng)高質(zhì)量發(fā)展、加快構(gòu)建新發(fā)展格局的重要抓手。
2025年我國人均糧食占有量達(dá)到508.9公斤,遠(yuǎn)超國際公認(rèn)的400公斤的安全線,糧食等重要農(nóng)產(chǎn)品供給豐富、市場平穩(wěn)、儲(chǔ)備充足。
一代代南來北往的科研“候鳥”安心在三亞當(dāng)起了“留鳥”,南繁熱土上,他們用堅(jiān)守加速農(nóng)業(yè)科研進(jìn)程,守護(hù)著國家糧食安全的希望。
工業(yè)和信息化部等八部門近日聯(lián)合印發(fā)《汽車數(shù)據(jù)出境安全指引(2026版)》,推動(dòng)建立高效便利安全的汽車數(shù)據(jù)跨境流動(dòng)機(jī)制,提升汽車數(shù)據(jù)出境便利化水平。
月球表面的年齡是揭示其演化奧秘的基礎(chǔ)。對于月球上未采樣的區(qū)域,科學(xué)家主要依靠統(tǒng)計(jì)撞擊坑的密度來估算年齡:區(qū)域越古老,撞擊坑通常越密集。
近日,內(nèi)蒙古大學(xué)化學(xué)化工學(xué)院劉健教授、王艷琴副教授團(tuán)隊(duì)在節(jié)能制綠氫聯(lián)產(chǎn)高附加值化學(xué)品領(lǐng)域取得重大突破,在《自然》子刊發(fā)表研究成果。