(資料圖)

科技日報北京5月17日電 (記者劉霞)加拿大科學家在16日出版的《放射學》雜志上刊登新論文稱,最新版本的ChatGPT通過了美國放射學委員會的考試,突出了大型語言模型的潛力,但它也給出了一些錯誤答案,表明人們仍需對其提供的答案進行核查。

為評估ChatGPT在美國放射學委員會考試問題上的表現并探索其優勢和局限性,多倫多大學研究人員首先測試了基于GPT-3.5的ChatGPT的表現。研究團隊使用了150道選擇題,這些選擇題與加拿大皇家學院和美國放射學委員會考試的風格、內容和難度相當。這些問題不包括圖像,分為低階(知識回憶、基本理解)和高階(應用、分析、綜合)思維問題。高階思維問題可進一步細分為影像學表現描述、臨床管理、計算和分類、疾病關聯。

研究人員發現,基于GPT-3.5的ChatGPT的正確率為69%,接近70%的及格線。該模型在低階思維問題上表現相對較好,正確率為84%,但回答高級思維問題時表現不佳,正確率僅為60%。而性能更優異的GPT-4的正確率為81%,且在高階思維問題上的正確率為81%,遠好于GPT-3.5。但GPT-4在低階思維問題上的正確率僅為80%,答錯了12道題,而GPT-3.5全部答對了這些題目,這引發了研究團隊對GPT-4收集信息的可靠性的擔憂。

這兩項研究都表明,ChatGPT會有提供不正確答案的傾向,如果僅僅依靠它獲取信息,非常危險,因為人們可能意識不到其給出的答案是不準確的,這是它目前面臨的最大的問題。(來源:科技日報)

備案號:贛ICP備2022005379號-1
華網(http://www.b3q24.cn) 版權所有未經同意不得復制或鏡像

聯系電話:17051177829 QQ:51985809郵箱:51985809@qq.com

主站蜘蛛池模板: 亚洲在线电影 | 亚洲一区二区三区在线观看视频 | 国产精品成人一区二区网站软件 | 亚洲视频一区二区三区在线观看 | 91精品国产永久在线观看 | 午夜影院操 | 九九99热久久精品66中文字幕 | 亚州国产 | 亚洲天堂三区 | 日韩黄色免费网站 | 国产精品片一区二区三区 | 国产91免费看| 一区二区影视 | 干片先生在线观看 | 特黄一级视频 | 黑人疯狂做爰xxxⅹ高潮软件 | 91麻豆欧美成人精品 | 国产成人久久av免费高清密臂 | 亚洲视频三区 | 国产成人自拍视频在线观看 | 亚洲精品www久久久久久 | 国产福利视频奶水在线 | 日韩一区二区三免费高清在线观看 | 狠狠撸在线| 成人xxxxx| 一级毛片一级毛片一级毛片 | 一区二区三区 在线 | 日日摸日日干 | 亚洲视频网 | 欧美乱码视频 | aaa在线观看| 亚洲蜜桃视频 | 欧美影院一区 | 日韩小视频在线 | 欧美日韩一区二区三区不卡 | 日韩免费1区二区电影 | 成人国产精品入口免费视频 | 一区二区在线视频观看 | 国产91精品入口福利 | 99seav| 午夜私人影院 |