欢迎您访问广东某某机械环保科有限公司网站,公司主营某某机械、某某设备、某某模具等产品!
全国咨询热线: 400-123-4567

新闻资讯

哈希游戏| 哈希游戏平台| 哈希游戏APP

HAXIYOUXI-HAXIYOUXIPINGTAI-HAXIYOUXIAPP

哈希游戏- 哈希游戏平台- 官方网站共话大模型技术进展与挑战CCF大模型论坛北京会议圆满落幕!

作者:小编2025-04-14 14:46:11

  哈希游戏- 哈希游戏平台- 哈希游戏官方网站智谱AI GLM 技术团队研究员顾晓韬、清华大学长聘教授、国家杰青黄民烈、华为语音语义首席科学家刘群、复旦大学计算机学院教授邱锡鹏、阿布扎比技术创新研究所研究员 Quentin Malartic、清华大学电子工程系长聘教授、系主任汪玉、清华大学计算机系长聘教授、清华大学计算机系高性能所副所长翟季冬、清华大学计算机系博世 AI 教授、清华大学人工智能研究院副院长朱军、哈尔滨工业大学计算学部长聘教授,人工智能研究院副院长车万翔等大模型领域专家学者受邀出席并做主题报告。(按姓名拼音首字母排序)

  CCF大模型论坛常务会员、哈尔滨工业大学车万翔教授指出现有的思维链研究仍面临两大挑战:(1)缺乏对思维链能力评估的定量指标;(2)缺乏对思维链能力优化的指导。为此,他们引入了一种新颖的“推理粒度”框架来解释思维链技术的机理,并使用该框架改进思维链的推理能力。进一步地,通过在众多模型和任务上的实验,表明了该框架的存在性和合理性。此外,该框架还能够用于解释多种思维链策略的有效性,并能够从两个角度共同指导思维链策略的优化。

  CCF大模型论坛执行会员、清华大学翟季冬教授就当前大模型技术不断发展,其对算力的需求持续增大的这一问题展开讨论,并指出当前中国在获取最先进的芯片方面面临巨大的挑战。如何充分发挥国产算力硬件性能,让国产算力易用好用,满足大模型对算力的需求具有重要意义。针对此挑战,他们团队在国产智能算力上开展核心基础软件相关研究。其中,在新一代国产超级计算机上,他们从编译器、算子库、并行加速和负载均衡等方面对大模型进行了深入优化,优化后的训练性能达到 EFLOPS。

  此外,本次会议还举办了两场别开生面的 Debates。黄民烈(清华大学)、俞涛(零一万物联合创始人)、顾晓韬(智谱AI 算法研究员)、李伯勋(无问芯穹算法负责人)、曾国洋(面壁智能 CTO)、何家傲(清华大学博士研究生)等来自不同领域的专家学者,就「超级对齐的本质是什么?」、「Maas 是个伪命题吗?」等问题,展开了现场交锋,为广大参会者呈现了一场精彩且深刻的思想探讨。两场 Debates 分别由邱锡鹏教授、CCF大模型论坛主席唐杰教授主持。

  俞涛:我们在对齐 GPT-4 水平模型的过程中,主要方法是基于人类专家反馈数据的强化学习。但人类将无法规模化地为下一代模型提供可靠的监督信号,或者给予反馈的效率远远低于 AI 迭代的效率,因此我们目前的对齐技术不能扩展到超级智能。我们需要做好超级对齐的研究和技术预研,包括 weak-to-strong generalization(从弱到强的泛化)、可解释性(可解释性)、scalable oversight(可扩展的监督),为 AGI 的到来做好准备。