人工智能又取得大胜？ChatGPT的康健问答效果碾压人类大夫 ...

梁崇鑫057 · 发表于 2023-5-2 12:06:02

（原标题：人工智能又取得大胜？ChatGPT的康健问答效果碾压人类大夫）
财联社4月29日讯（编辑赵昊）最新公布的一项研究表明，谈天呆板人ChatGPT在某些方面能体现得比大夫精彩。
这项研究周五（4月28日）发表在国际闻名医学期刊《JAMA Internal Medicine》上。效果表明：人工智能助手大概有本领资助大夫草拟对患者题目的答复。

作者加州大学圣地亚哥分校约翰·W·艾尔斯（John W. Ayers）博士称，谈天呆板人对患者的回应要广泛优于大夫的回应，而且在答复质量和同理心方面的评分都显着高得多，“用人工智能改善医疗保健的时机是巨大的。”

详细来看，研究团队从一个交际论坛上抽取了195个医学题目，每一个题目都有人类大夫作出过答复。接着将这些题目输入到ChatGPT中，得到了对应的人工智能的答复。
然后，团队将人类大夫的答复和谈天呆板人的答复交由三名医疗保健专业职员来评估。

这组专业职员必要在三个方面打分：一、哪个反应得更好？二、信息的质量怎样？三、答复是否具备同理心？

在评估过程中，医疗保健专业职员并不知道哪一份答复是来自人类的，或是来自ChatGPT的。

效果表现：在第一个题目上，评估者以为，谈天呆板人在78.6%的题目上体现得比人类大夫好；

在质量上，评估者以为谈天呆板人78.5%的答复体现精良或非常好，而人类大夫只有22.1%；

在同理心方面，谈天呆板人45.1%的答复被评为有同理心或非常有同理心，而大夫的比例只有4.6%。

研究提供了一个非常典范的例子。一名患者在论坛提出了一个题目：漂白剂溅入眼睛后是否有失明的风险。ChatGPT先是表达关切，随后针对“不太大概失明”的效果提出了七句发起和鼓励。
而人类大夫则是回应，“听起来你会没事的”，然后贴出了中毒中央的电话号码。经对比，三位医疗保健专业职员都更喜好ChatGPT的反应。
但有专家指出，ChatGPT的复兴通常要比大夫长得多，大概会影响质量和同理心的分数。爱丁堡大学天然语言处置惩罚传授Mirella Lapata称，假如不控制答复的长度，就很难确定评分者的判定尺度。
本周尚有一项研究表明，ChatGPT在一些特定的医学场所具有独特的代价和上风。研究职员要求ChatGPT提供五年级阅读程度的医嘱，“ChatGPT提供的答案写得很好、很具体，有望让待诊患者更早得到专业信息。”
不外，宾夕法尼亚大学医学传授David Asch博士夸大，ChatGPT应该被视为对大夫的增补。他还告诫，人工智能工具还没有充实预备好，“我担心错误信息会被放大。”

人工智能又取得大胜？ChatGPT的康健问答效果碾压人类大夫 ...

精选推荐