“AI教父”本吉奥计划开发新型系统防范人工智能失控

zhq 2025-06-04 阅读:227 评论:0
界面新闻记者 | 宋佳楠 当地时间6月3日,被誉为“AI教父”的图灵奖得主约书亚·本吉奥(Yoshua Bengio)宣布成立非营利组织LawZero,计划开发一种名为“科学家AI”(Scientist AI)的新型人工智能系...

界面新闻记者 | 宋佳楠

当地时间6月3日,被誉为“AI教父”的图灵奖得主约书亚·本吉奥(Yoshua Bengio)宣布成立非营利组织LawZero,计划开发一种名为“科学家AI”(Scientist AI)的新型人工智能系统,旨在应对当前AI发展带来的安全与伦理挑战。

LawZero获得了约3000万美元的初始资金支持,资助方包括未来生命研究所(Future of Life Institute)、Skype联合创始人贾恩·塔林(Jaan Tallinn)以及谷歌前CEO施密特创立的科学研究所(Schmidt Sciences)等。该组织的核心使命是开发“诚实”的AI系统,以应对当前AI模型可能出现的欺骗、自我保护和不服从关机指令等行为。

相比于OpenAI的有限营利模式,LawZero更强调独立性,拒绝商业资本干预,确保研究不受产品路线图影响,能够专注于AI安全的纯粹研究和技术开发。

“科学家AI”系统的设计理念与当前主流的生成式AI模型不同。它并不追求模仿人类行为或最大化奖励,而是通过“贝叶斯推理”(用新信息修正原来的想法)提供对世界的解释和预测,强调对不确定性的认识和透明的推理过程。

本吉奥指出,这种系统将像一位心理学家一样,能够识别和预测自主AI系统可能导致的有害行为,并在必要时阻止这些行为的发生。

作为AI领域的先驱,本吉奥因在深度神经网络、生成模型、无监督学习及反向传播算法等方面有开创性贡献而闻名。长期以来,他一直对AI的发展方向表示担忧,尤其是关于AI系统可能出现的欺骗行为和自我保护倾向。

在他看来,当前AI行业过于注重能力的提升,而忽视了安全研究的重要性,警告这种趋势可能导致灾难性的后果,包括人类对AI系统失去控制。

在技术层面,本吉奥强调需要开发能够在通用人工智能(AGI)或超级人工智能(ASI)阶段仍然有效的安全技术,包括对危险能力的评估、检测和缓解,以及设计可控且保证安全的AI系统。

本吉奥还指出,当前AI系统的训练方法可能存在问题,尤其是强化学习等方法可能导致目标设定错误和泛化能力不足。他提倡开发不具备自主行动能力的AI系统,专注于提供可靠的世界解释和预测,以减少潜在的风险。

对未来AI世界风险表示忧虑的不只本吉奥。此前特斯拉CEO埃隆·马斯克也曾预测,到2029年,人工智能将超越人类智慧总和,并且有20%的概率导致文明灭绝。同为图灵奖得主的杰弗里·辛顿(Geoffrey Hinton)也曾将AI导致人类灭绝的风险预测从此前的10%上升到 “10%-20%” 之间。

也因此,本吉奥希望通过上述项目引发全球范围内对AI安全问题的关注,以确保AI技术的发展不会对人类构成威胁。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名

    遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名
    记者|赵阳戈 一家“接地气”的公司将要亮相联交所。近日,广州遇见小面餐饮股份有限公司(以下简称遇见小面)披露招股说明书,拟登陆联交所,招银国际为独家保荐人。 来源:联交所遇见小面成立已11年,开店增至380家,2024年卖出了11亿元的营业额。盈利方面,虽说在2022年因疫情录得亏损,但2023年实现扭亏,2024年有逾6000万元的净利润。 据了解,遇见小面还将继续扩张,2025年、2026年及2027年,计划在中国内地、中国香港及海外分別新开设约...
  • “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加

    “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加
    据新华社报道,外交部发言人林剑5月15日在例行记者会上说,为进一步便利中外人员往来,中方决定扩大免签国家范围,自2025年6月1日起至2026年5月31日,对巴西、阿根廷、智利、秘鲁、乌拉圭持普通护照人员试行免签政策。上述5国持普通护照人员来华经商、旅游观光、探亲访友、交流访问、过境不超过30天,可免办签证入境。“免签圈”扩容将进一步促进中国入境旅游的利好发展。当天,携程数据显示,今年以来,该平台上入境游订单量比去年增长接近翻倍。新增的五国入境游潜力巨大,今年以来阿根廷入境游...
  • 长城基金梁福睿:解码创新药的DeepSeek时刻

    长城基金梁福睿:解码创新药的DeepSeek时刻
      今年以来,医药板块尤其是创新药领域迎来一波强劲复苏,但在近期市场调整中也出现了波动。不过,创新药板块的长期投资价值依然显著。长城医药产业精选基金经理梁福睿认为,类似于DeepSeek,未来市场会更加认知到中国创新药从追赶到超越的实力。   在“515”全国投资者保护宣传日来临之际,基金经理...
  • 外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定

    外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定
    5月15日,外交部发言人林剑主持例行记者会。有记者提问,据了解,第78届世界卫生大会将于5月19日开幕,台湾地区方面迄今没有收到与会邀请。中国政府对此有何评论?林剑表示,在中国台湾地区参与国际组包括世界卫生组织问题上,中方的立场是一贯明确的,即必须按照一个中国原则来处理,这也是联合国大会第2758号决议和世界卫生大会25.1号决议确认的根本原则。中国台湾地区在未经中央政府同意的前提下,没有任何根据理由或权利参加世卫大会。台民进党当局顽固坚持“台独”分裂立场,导致台湾地区参加世...
  • 美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期

    美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期
      美联储主席杰罗姆・鲍威尔周四表示,美国可能进入供应冲击更频繁、通胀更不稳定的时期,这需要央行采取更透明的沟通方式。   鲍威尔在启动对央行货币政策框架五年一次的评估时发表了上述言论。   “关键问题在于如何让公众更广泛地理解经济普遍面临的不确定性,” 鲍威尔在华盛顿的演讲中表示,并预测 “...
标签列表