75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类!AI通过了标准的三方图灵测试,这标志着人工智能技术取得了重大突破。加州大学圣迭戈分校的研究人员系统评估了四个AI系统,证明大语言模型(LLM)能够成功通过图灵测试。这意味着未来与你热聊的“熟悉陌生人”可能并不是真人。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI

在测试中,参与者需要同时与人和AI系统进行5分钟的对话,然后判断哪位是真人。结果显示,GPT-4.5以73%的比率被认作人类,显著超越真实人类参与者;LLaMa-3.1-405B获得56%的识别率,与人类无显著差异。这些结果表明,AI在模仿人类行为方面已经非常出色。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

这项研究对理解LLM的智能本质以及其在社会经济方面的影响具有重要意义。艾伦·图灵提出的图灵测试,旨在通过纯文字聊天界面判断机器是否具备智能。如果测试员无法准确区分真人和AI,就说明机器通过了测试。过去75年里,许多人尝试开发能通过图灵测试的系统,但直到最近,随着LLM的发展,这一目标才得以实现。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

研究人员进行了随机对照的三方图灵测试,评估了GPT-4.5、LLaMa-3.1-405B以及基准模型GPT-4o和ELIZA的表现。实验结果显示,当使用特定角色提示时,GPT-4.5-PERSONA的胜率为73%,LLAMA-PERSONA的胜率为56%。相比之下,没有角色提示的模型表现较差,整体胜率分别为36%和38%。基准模型GPT-4o-NO-PERSONA和ELIZA的胜率分别为21%和23%。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

为了进一步分析测试结果,研究人员探讨了参与者采用的不同策略和判决理由。最常见的策略是闲聊,询问日常活动或个人细节。最有效的策略包括说一些奇怪的话或使用典型的LLM“越狱”技巧。最常见的判决理由是对话语气和互动动态,许多参与者依赖直觉判断。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

这些结果引发了一些重要的问题:LLM通过图灵测试意味着什么?人类在智力上被AI超越了吗?尽管GPT-4.5-PERSONA在两项研究中的胜率显著高于偶然性,但这主要归功于特定的角色提示。因此,系统的行为不仅取决于模型本身,还取决于编写提示的AI研究员。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

未来的研究可以探索更多实施方式,如延长测试时间或改变参与者群体,以更全面地评估LLM的能力。图灵测试本质上测量的是拟人性而非直接智能,但当机器智能逼近人类时,其他差异维度变得更为重要。最终,智能的多元性决定了任何单一测试都不具决定性。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

此外,LLM的成功也可能带来广泛的社会影响。AI可以在短时间内与人类进行对话,而对话者无法分辨出差异。这可能导致人们花费越来越多的时间与这些“伪造的人类”互动,从而削弱真实人类互动的价值。如何检测这种欺骗成为了一个亟待解决的问题。尽管某些策略比其他策略更有效,但整个群体的辨别准确度相对均匀。未来的研究可以探索如何教授这些技巧,以提高人们辨别人类和机器的能力。

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

75年后,图灵测试终被GPT-4.5破解,73%人类被骗过,彻底输给AI 机器智能超越人类

主题测试文章,只做测试使用。发布者:宫外财经,转转请注明出处:https://www.gongwai.cn/4534.html

(0)
宫外财经的头像宫外财经
上一篇 2025年4月3日 下午12:04
下一篇 2025年4月3日 下午12:04

相关推荐

  • 五哈5没有老舅 鹿晗也缺席录制

    4月7日,综艺节目《哈哈哈哈哈》第五季(简称《五哈》)宣布了嘉宾阵容,邓超、陈赫、范志毅、王勉四人继续担任“五哈团”成员。随后,话题#五哈5艺人官宣#登上微博热搜。 第四季“五哈团”嘉宾中的鹿晗和“宝石老舅”将缺席第五季的录制。3月17日,节目组宣布《五哈》第五季正式回归,并表示:快乐无边际,神金顶峰见!和五哈团一同开启大好河山深度游,敬请期待《哈哈哈哈哈》…

    2025年4月7日
    700
  • 特朗普让墨西哥还水16亿立方米 水资源争端升级

    美国和墨西哥之间的水资源争端近日再次升级。美国总统特朗普4月10日指责墨西哥违反了已有81年历史的两国水资源条约,并“窃取了得州农民的水资源”,威胁要对墨西哥实施制裁和关税。特朗普在其社交平台上表示,根据1944年《水条约》,墨西哥欠得州130万英亩英尺的水(约合16亿立方米),但墨西哥违反了其条约义务。他强调将继续加大惩罚力度,包括关税甚至制裁,直到墨西哥…

    2025年4月12日
    1000
  • 搜狐新闻马拉松 威海公交线路临时调整

    3月27日,第十七季搜狐新闻马拉松将在威海市区举行。根据赛事需求和交通管制措施,当天10时至13时30分,威海公交集团将对途经赛道路段的多条公交线路进行临时调整。 1路公交车由江家寨立交桥发车,运行至威高广场站点后,改行新威路、文化东路、菊花顶路、纪念路至实验中学,取消三角花园一个站点。返回时按原线路运行。 5路公交车由实验中学发车,改行海滨北路至鲸园小学(…

    2025年3月27日
    2600
  • 美联储的独立性对于应对通胀很重要:通胀应对的核心支柱

      近期,美联储主席鲍威尔面临来自特朗普政府的强烈压力,要求其调整货币政策以支持经济增长。这一事件再次凸显了美联储独立性在应对通胀问题中的关键作用。根据芝加哥联储行长奥斯坦古尔斯比的观点,美联储的独立性是实现长期通胀目标(如将通胀率稳定在2%)的重要保障。   美联储的独立性不仅体现在其制定利率政策时不受政治干预,还在于其能够灵活应对经济波动和通胀压力。例如…

    2025年4月22日
    300
  • 长沙南站发声明致歉 空调升级改造期间增设降温措施

    近日,多位旅客反映在长沙南站候车室因空调未开启而感到闷热难耐。4月20日,广铁集团长沙南火车站发布声明并致歉。根据气象预报,从4月21日起,长沙地区气温将显著升高。由于长沙南站的空调系统正在进行升级改造,预计到4月25日才能试运行新系统。为缓解高温影响,车站将在候车室各区域增设40台工业风冷机,并在“湘遇长南 雷锋服务站”设立临时医疗服务点,配备防暑降温药品…

    2025年4月21日
    600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信