【中国观察2026年02月12日讯】
牛津大学的一项重要研究发现,使用人工智能进行医疗指导的人正确识别病情的准确率不到 34.5%,其表现并不比传统方法更好,有时甚至更差。
虽然人工智能模型在自动化测试中能够以 94.9% 的准确率识别出各种情况,但当由真人使用时,其性能却急剧下降,因为真人经常提供不完整的信息,并会收到相互矛盾的建议。
这些模型对问题的措辞非常敏感,可能会给出错误的诊断,并且经常“臆想”出虚假的临床细节或研究结果,其中高达 25% 的回答是捏造的。
随着科技公司将人工智能推向医疗保健领域,超过三分之一的英国居民表示正在使用人工智能来改善健康状况,这些工具的部署缺乏严格的、人工参与的测试,以确保其对公众使用是安全的。
该研究得出结论,目前的AI尚不具备担任医生的能力,因为它无法进行体格检查,也无法全面了解患者的情况。因此,务必向持证专业人士核实任何AI提供的健康建议,以避免造成严重伤害。
一项重要的最新研究发出严峻警告,打破了人工智能革命的炒作浪潮。该研究揭示,人工智能聊天机器人经常提供错误且前后矛盾的医疗建议,对公众构成直接风险。这项由牛津大学开展的研究于2月9日发表在权威期刊《自然医学》上,得出了一个令人警醒的结论:尽管大型语言模型拥有先进的功能,但它们远未做好充当医生的准备。研究结果引发了人们对在医疗保健领域快速部署这些系统的迫切质疑,并凸显了实验室性能与现实世界中人际互动之间存在的严重脱节。
对医疗保健炒作的现实检验
这项由医疗专家和人工智能研究人员主导的研究,是迄今为止规模最大的人工智能在公共医疗指导领域实际应用测试之一。研究人员招募了近1300名英国成年人,并向他们展示了详细的医疗案例。参与者被分成若干组,一组使用GPT-4o、Llama 3和Command R+等流行的人工智能模型辅助就医,而对照组则使用传统方法。
结果令人震惊。使用人工智能的组别表现并不比对照组更好,在某些方面甚至更差。人工智能用户正确识别相关疾病的概率不足34.5%,与传统方法相比并无优势。更令人惊讶的是,对照组正确识别疾病的概率是使用人工智能组的1.76倍。
能力错觉
一项关键发现是,人工智能在受控测试中的表现与它在真实人际互动中的表现之间存在巨大鸿沟。当研究人员在无菌的自动化测试中将医疗场景直接输入人工智能模型时,系统表现出色,正确识别病情的准确率高达94.9%。然而,这种技术优势在复杂多变的人际互动中却不堪一击。
首席医疗官丽贝卡·佩恩博士指出,这些发现应该起到明确的警示作用。人工智能目前还无法胜任医生的角色。她强调,向语言模型询问症状可能很危险,因为它可能会给出错误的诊断,或者无法识别出患者需要紧急治疗的情况。
为什么人机交互会破坏机器人
用户往往不知道该向人工智能提供哪些信息,只能提供部分描述。反过来,人工智能模型对问题的措辞非常敏感,即使措辞稍有不同,给出的建议也截然不同。例如,在某个案例中,两位用户描述了类似的危及生命的脑卒中症状,却从同一个人工智能那里得到了截然相反的建议。
此外,聊天机器人通常提供的信息真假混杂,用户不得不费力筛选相互矛盾的建议。资深作者亚当·马赫迪博士称这一差距敲响了警钟,他认为人工智能系统在被认为可以安全用于公共医疗保健之前,需要进行类似于临床试验的严格的、由人工参与的测试。
在公众使用量不断上升的情况下,急于部署
这项警示性研究的出台正值科技公司积极推动人工智能深入医疗健康领域,且公众使用速度加快之际。英国2025年11月的一项民意调查发现,超过三分之一的居民曾使用人工智能来改善心理健康或提升幸福感。这一趋势对开发者和监管机构提出了巨大的责任,他们必须确保这些工具的安全性。
专业医疗机构坚决认为,人工智能只能作为医生判断的补充,而不能取代医生的判断,原因就在于它无法进行体格检查,也无法全面了解患者的生活背景。正如一份报告总结的那样,“虽然人工智能有潜力弥合公众健康素养方面的差距,但它也存在传播脱离语境的——甚至是危险的——信息的风险。”
这种风险并非纸上谈兵。令人担忧的是,越来越多的患者盲目听从聊天机器人的建议,最终被送进急诊室。这些案例揭示了人工智能算法的缺陷如何导致致命的误导,同时又能逃避责任。随着人工智能的应用日益普及——从症状检查到虚拟护理助手——错误信息带来的风险也日益凸显。2023年的一项研究发现,语言模型经常会臆造出错误的临床细节,这可能导致误诊。
历史背景:从百科全书到算法权威
核心问题在于信任和验证。大型语言模型基于从互联网抓取的海量数据集进行训练,这些数据集中包含已知存在偏见、矛盾和不准确之处的信息来源。它们正以前所未有的规模合成和重新包装人类知识。
这项研究强调,将复杂且经验性的医学艺术压缩成统计预测模型充满风险。尽管科技公司强调免责声明,但案例表明,这些警告很容易被忽视。聊天机器人经常误诊病情,甚至捏造虚假研究。高达25%的AI回复是捏造的,但免责声明却常常被省略,误导用户轻信有害建议。
谨慎之举
牛津大学的这项研究给出了明确的诊断:当前一代人工智能在医疗护理方面存在严重不足。人工智能在医学领域的应用前景依然广阔,但要实现这一目标,需要保持谦逊和严谨的态度。
一项里程碑式的研究揭示了人工智能在医疗建议方面的危险缺陷
责任编辑:雨轩 来源:中国观察 转载请注明作者、出处並保持完整。
分享 Facebook | X | WhatsApp | LinkedIn
捐助(Paypal): https://www.paypal.me/observeccp 订阅中国观察电报 Telegram : https://t.me/s/ObserveCCP
即时新闻
- 一枚硬币,一座城市的温度——从卡尔加里公交投币说起
- 最新研究:每天久坐加1小时 癌症死亡风险增10%
- 研究揭秘:幽默不是开玩笑 而是抗老良药
- 苹果多款产品涨价 专家点名5款不划算先别买
- 系外行星在恒星死亡后幸存 科学家探究原因
- 电脑打字忘了怎么写?汉字动画带孩子找回温度
- 屏东夏日狂欢祭 巧虎+蜡笔小新伴亲子Fun暑假
- 台湾将设凤凰城办事处 美国务院乐见关系深化
- 毕业季抢人! 123家企业释6千职缺 现场挤爆
- 布拉格机场移除各国国旗 台湾旅客自动通关资格不变
- 错过等明年!桃园莲花季登场 网美必拍大王莲
- 台运动部长李洋跳街舞 谈体育改革盼帮助选手
- 从战场飞进校园 嘉义无人机探索体验营3日开跑
- 模拟中共趁强震入侵 台湾城镇韧性演练强化应变
- 范冰冰出席富川影展 羡慕韩国影业题材丰富
- 中共侨联副主席追悼会举行 传跳楼身亡
- 55国战舰齐聚纽约港 美国250周年庆典现场!
- “60岁按月领取50万” 深圳男缴保30年仅兑付1个月
- 【中国一分钟 】送AI机器人去上学?专家揭穿中共科技补贴骗局
- 台湾海巡斥中共海警台湾东部“假执法 真扩权”
- 美国独立日 尼克松图书馆邀民众走入历史
- 时代广场水晶球八度降落 全美迎建国250周年
- 600万儿童已注册!川普账户上线 怎么领?
- 藤森庆子当选秘鲁总统 拉美保守派再下一城
- 哈梅内伊六日送葬 分析:伊朗社会分裂难掩
- 美国250庆典 空中飞出巨型“USA 250”字样
- 乌无人机突袭圣彼得堡 俄边境全城断电!
- 倾全国之力撑场面 哈梅内伊国葬变动员令?
- 英军高度戒备 中国电动车被挡军事基地外
- 美独立日遇热浪 84万户停电 华府大游行取消
热点新闻
- 川普首次回应 家族加密货币投资获利14亿
- 俄秘密监视北约?18个月盯上欧洲核基地
- 湖南政协62岁副主席张灼华任上落马
- 因多次报警 武汉男子两度被警察强制送精神病院
- 美国非农就业报告远低于市场预期 国际金价飙涨逾2%
- 习晋升两上将 军队大清洗后人事新布局?
- 西安赛格逼死商户更多黑幕 亿万富豪被掏空维权至今
- 加拿大菲律宾升级为战略伙伴关系 重申印太安全
- 北戴河会议前人事频动 专家析中共内斗动向
- 油价连跌!美国独立日前迎来好消息
- 7月3日维权动态 中共信访新规上路 北京大规模驱赶访民
- 出生公民权禁令虽受阻 律师:赴美生子难度增
- 世界杯 瑞士2:0阿尔及利亚 葡萄牙淘汰克罗地亚
- 美增兵中东紧盯霍尔木兹海峡 双远征队压境
- 世界杯第23日看点:佛得角挑战阿根廷 16强揭晓
- 美国民众:身为美国人无比自豪
- 后方被乌炸烂?俄招聘网站急招无人机飞手
- 美庆祝建国250周年 独立宣言影响无远弗届
- 川普专访谈家族生意 大赞经济表现炮轰美联储
- 台风美莎克袭击海南三亚:海水倒灌 惨不忍睹
更多推荐
- 从零开始建立数字产品销售渠道
- 养好一个男孩,比修好一个社会更重要
- 被忽视的温暖:中国普通百姓的善良与海外舆论的偏差
- 家里有钱但亲戚多,怎样把财富藏得优雅
- 高收入家庭的信托架构设计思路
- 当判断一再落空:海外中文舆论如何在中国政治问题上迷失
- 海外创业者必须了解的商业保险
- 北美家庭理想庭院设计月预算指南
- 纽森怒斥真相爆料者而非开枪罪犯,加州枪击ICE事件引发公愤
- 投资组合里必须有一项是防御型,否则你赚得再多也守不住
- 不拼品牌的中年生活美学:五种细节反映真实品味
- 重拾清晨时光:科学策略助你从夜猫子变成早起鸟
- 锌有助于修复衰老免疫系统的控制中心
- 远程办公者不可不知的五大生活成本陷阱
- 密尔沃基遭遇“史无前例”洪灾,进入紧急状态
- 离岸信托与避税的合法边界
- 新车价格上涨趋势背后隐藏了哪些产业逻辑
- 在算法洪流中守住真实:中国新一代对朴素价值的追寻
- 退休移居:哪些国家最值得申请第二身份?
- 美国消费者保护法在房屋装修中的应用
- 北美精英最爱的十个私密海岛度假村
- 荷尔蒙时钟:女性大脑健康的新领域
- iPad vs MacBook:旅行中哪一个更实用?
- 悄然的变革:睡前六分钟的伸展运动如何重塑美国人的睡眠健康
- 看不见的毒药:天空中的杀虫剂如何使雨水变得有毒
- 香港街市的鱼腥和香料味
- 全球财富正在悄悄重新排序,你在哪一列?
- 欧盟数字护照系统的真实用途
- 哥伦比亚卡塔赫纳的殖民建筑 时间在此并未移动
- 李子柒与短视频时代的中国价值观逆转
- 当你不再追求升职,就开始自由了
- 旅行医疗保险购买指南
- 美国签证审查与社交媒体审查政策的关系
- 租车比买车更划算的情况你了解吗
- 打造理想北美庭院的五大关键元素
- 88%的美国人担心记忆力衰退,但只有9%的人知道如何保护大脑健康
- 高收入人群如何合法降低税负的五种路径
- 加拿大最新税务居民认证与避税流程
- 隐形流行病:你是否患有维生素D缺乏症却不自知?
- 好脂肪与坏脂肪:一项新研究揭示了人体如何处理它们的不同方式