首页 >> 新闻公告 >> 尊龙凯吋官方网站 >> 正文

凯时尊龙人生就是博学术沙龙第十一期举行

信息来源: 尊龙凯吋官方网站新闻网发布时间:2025-03-07 浏览量:

2025年3月5日下午，“数字与人文节气沙龙”系列活动第四十期暨凯时尊龙人生就是博学术沙龙第十一期在百周年纪念讲堂四季庭院举行。沙龙主题是“人工智能中的价值对齐”，旨在探讨如何确保AI的安全性与可控性并思考未来AI发展的方向。

图片1.png

活动海报

沙龙由人生就是博-尊龙凯时助理教授、博雅学者、博古睿学者杨耀东主讲，尊龙凯吋官方网站哲学系助理教授王昱洲进行对谈，主要邀请哲学系、政府管理学院、法学院等多个院系的专家学者参加活动。沙龙由人生就是博-尊龙凯时副研究员、数字人文与文明演化研究中心执行主任杨浩及社会科学部副部长郭琳主持。

图片2.jpg

杨耀东作主题分享

杨耀东指出，人工智能作为当代科技发展的前沿领域，其发展速度之快和影响力之大已远超传统技术。随着人工智能在社会各领域的广泛应用，其决策和行为是否符合人类价值观成为了一个亟待解决的问题。价值对齐，即确保人工智能系统的决策和行为与人类的核心价值观保持一致，已成为数字与人文交叉研究的重要课题。

杨耀东详细介绍了人工智能价值对齐的技术路径，包括预训练与对齐的结合、基于人类反馈的强化学习（RLHF）以及多阶段对齐策略。他指出，尽管技术路径已经明确，但价值对齐仍面临诸多挑战，如价值观的多样性与动态性、模型的复杂性与不可解释性，以及对齐的边界与超对齐问题。当前的人工智能模型大多基于人类的语料进行预训练，这些语料本身反映了人类社会的复杂性和多样性，其中可能包含与人类核心价值观不一致的内容。因此，对齐过程需要在预训练的基础上，通过人类标注员的反馈和强化学习算法对模型进行优化。他认为，未来的发展方向需要加强跨学科合作，建立安全对齐框架，并探索多模态与多领域对齐的可能性。

图片3.jpg

王昱洲进行对谈回应

王昱洲从哲学和伦理学的角度对价值对齐问题进行了深入分析。他认为，价值对齐的核心在于定义“什么样的价值观是值得追求的”，而不仅仅是让人工智能符合某种既定的价值观。王昱洲指出，预训练模型所反映的价值观可能是人类社会的真实写照，而我们所追求的价值对齐，或许应该是一种“更理想化的价值观”。

王昱洲进一步强调，价值对齐需要考虑价值观单一化风险、文化差异以及动态性等问题。首先，价值观的单一化风险可能导致少数专家的价值观被强加于所有人，从而限制人类的想象力和创造力。其次，不同文化背景下的价值观存在显著差异，如何在价值对齐中考虑文化多样性是一个亟待解决的问题。此外，人类的价值观是动态变化的，人工智能的价值对齐需要具备适应这种动态变化的能力。未来的人工智能不仅需要适应现有的价值观，还需要推动价值观的积极变化。王昱洲呼吁，应通过跨学科合作来推动人工智能与人类价值观的深度融合。

在自由讨论环节中，与会嘉宾围绕价值对齐的可能性与挑战问题展开讨论。多位嘉宾指出，跨学科合作是解决价值对齐问题的关键，但在实际操作中，不同学科之间的术语和概念差异可能导致交流障碍。杨耀东认为，跨学科合作的第一步是建立一个共通的术语体系，王昱洲认为，哲学和伦理学可以为跨学科合作提供理论框架。

此次沙龙活动不仅提供了一个跨学科的交流平台，也对人工智能的伦理与安全问题提供了深刻见解。在人工智能快速发展的今天，如何确保人工智能技术符合人类价值观和社会利益，已成为我们必须面对和思考的重要课题。

微信图片_20250306165426.png