人生就是博-尊龙凯时(中国)官方网站

凯时尊龙人生就是博戴俊韬、张钊为荣获华为“火花奖”

信息来源:     发布时间:2025-07-11     浏览量:

7月8日下午,“擦亮火花,共创未来” 华为公司2025年“难题揭榜”火花奖尊龙凯吋官方网站专场颁奖典礼在北京举行。尊龙凯吋官方网站副校长朴世龙,华为公司董事、2012实验室总裁查钧出席典礼并为获奖师生颁奖。

人生就是博-尊龙凯时杨耀东课题组戴俊韬、张钊为从4000余名揭榜者中脱颖而出,获得“火花奖”,其中张钊为是十名获奖者中唯一一名学生代表。


DF7A2  A8293  B279A


火花奖,取“火花碰撞”之意。自2021年11月起,华为公司把产业面临的老大难问题总结提炼为科学问题向社会发布,采用难题揭榜的形式,寻找基础理论扎实、有创新解题思路的人才,同时鼓励高校教师踊跃揭榜,解决真问题,真解决问题。


戴俊韬、张钊为:创新为核,实践为翼


21C18  1FFDB


价值观对齐的核心难点,便是难以找到落地场景。华为难题有着天然的落地基因。这种产学研的深度碰撞,不仅验证了实验室的理论探索,更能够帮助国家锻炼出一支攻坚克难的新生力量。


  • 关于获奖项目


戴俊韬和张钊为揭榜了面向大模型的多元价值观数据生成与对齐评估这一难题。


不同文化对同一行为的价值判断可能截然不同——例如,求职场景中,西方强调“个人成就”,而东方更重视“集体协作”。要让大模型真正服务全球用户,就必须解决价值观适配的挑战。传统人工标注方法成本高、覆盖面有限,难以应对多元文化的复杂性。因此,他们探索自动化、规模化的解决方案:通过合成多价值观数据,并建立科学的评估体系,推动大模型在跨文化场景中的精准对齐。


  • 关于项目的挑战与创新


1. 首先是如何将“价值观”拆解成机器能读懂的语言?


价值观过于抽象,模型容易“各说各话”。戴俊韬和张钊为基于规范伦理学,将政策文件和权威论文中的“大词”拆解为具体条目,构建了一套结构化价值观词典,像《新华字典》一样清晰定义标准,让模型不再“只可意会”。


2. 其次是如何让自动化地合成启发性的问题?


自动化生成的问题常平淡或跑题。戴俊韬和张钊为先用人工撰写“种子问题”示范,再训练模型学习提问逻辑,并通过规则过滤+奖励模型打分双重筛选,确保问题兼具启发性和场景贴合度。


3. 以及如何自动产出代表性的“好答案”和“反面教材”?


通过“分析→生成→校验”三步法:先解析问题中的价值冲突,再生成正面回答,最后基于五类典型偏差(如对立、极端化)主动构造反面案例,使生成过程透明可控。


4. 最后一个挑战是如何构建有迹可循的价值评估器?


人工评估易受主观影响。两位同学将打分拆解为多维度推理:模型先按价值观词典逐条分析,给出“支持/违背/中性”分类,再汇总结论。这一范式减少了偏见,让评分可追溯、可复现。


  • 关于获奖感想


首先感谢杨耀东老师的悉心指导,以及华为专家团队的鼎力支持。同时要特别感谢团队成员杨天琢、陈嘉玮、张郭熙的共同努力,这份荣誉属于整个团队。


94D84



价值观对齐研究长期面临落地难的困境,核心在于"价值观"概念的主观性。实验室通常采用简化的"无害性"等指标,而实际业务需求要复杂得多。通过华为揭榜项目,我们实现了前沿技术与产业需求的深度对接,这种产学研协同不仅验证了理论成果,更培养了一支能解决实际问题的科研队伍。


学术研究往往依赖模拟测试评估,虽能反映方法性能,但与真实场景存在差距。火花奖采用华为专业人员实地验收的方式,推动研究突破论文指标的局限,真正聚焦于完整解决问题,最终打磨出既前沿又实用的技术方案。




XML 地图