加州大学圣地亚哥分校的研究表明,人工智能系统首次通过了标准三方图灵测试。研究人员测试了GPT-4.5、Llama 3.1-405B和GPT-4o三款AI模型,结果显示,在模拟特定人类行为特征的PERSONA模式下,GPT-4.5的胜率高达73%,Llama 3.1-405B的胜率约为56%,远超基础指令模式。研究认为,GPT-4.5和Llama 3.1-405B在PERSONA模式下已通过图灵测试,它们有望在依赖简短对话的经济角色中取代人力,并广泛应用于各种社交场景,甚至成为难以区分的替代品。 [原文链接]