首页网站建设网站案例新闻资讯关于我们联系方式

昆仑万维开源 Skywork‑Reward‑V2，强化 RLHF 训练能力

发布时间：2025-07-10 作者：百仑科技本文链接： https://www.cqbailun.com/industry/772.html 关键词：Skywork‑Reward‑V2, RLHF, reward model, 人机协同, 开源 AI

7月4日，昆仑万维发布了第二代奖励模型系列 Skywork‑Reward‑V2，并同步开源。这次推出了8款从6亿到80亿参数规模的模型，覆盖 Qwen3、LLaMA3 等多个基座。目前，它已在七大主流奖励模型评测榜单上夺冠，展现出相比上一代更全面、更稳定的表现。

Skywork‑Reward‑V2 背后的亮点是其“人机协同、两阶段迭代”数据构建机制。昆仑万维先由人工标注出数百万条高质量对比样本，然后用大模型批量扩充，最终构建了 Skywork‑SynPref‑40M，混合偏好对比数据规模达到 4000 万，并筛选出约 2600 万优质样本用于训练。

即便是小型模型（0.6B 或 1.7B），在 RewardBench 等测试中也已能媲美甚至超越更大规模的开源模型。这背后说明：数据质量优先，有时比模型规模更关键。

对从事 AI 模型训练、RLHF 实践或智能体开发的团队来说，Skywork‑Reward‑V2 提供了一个高性能、可落地的开源奖励模型基础。无论是对话助手、内容审核、教学辅导，还是多 Agent 协作系统，这类高质量奖励模型都能显著提升对齐效果与安全性。

模型已同步放出至 HuggingFace、GitHub，并附带技术报告，欢迎开发者直接使用或贡献改进。能看到国内团队在核心基础模型层面实现这种突破，也确实让人感到振奋——期待更多社区版本出现！

微信在线咨询二维码

（微信扫码在线咨询，免费沟通建站方案）

上一篇：AVEVA中国智能创新中心成立，聚焦工业AI与数字孪生

下一篇：苹果发布《欧盟地区应用更新》，开放应用商店外购买路径

行业资讯相关文章 Look at trends, choose a direction, and build a promising website

阿里云通义灵码上线Qwen3-Coder，AI编程能力再升级

7月26日，阿里云正式上线了全新AI编程模型——Qwen3-Coder，并率先集成进通义灵码产品中。无论是写代码还是···

2025年1-7月中国搜索引擎市场份额：Bing稳坐PC端第一，百度在移动端遥遥领先

我们整理了StatCounter发布的最新数据，统计时间为2025年1月至7月，涵盖中国地区桌面端、移动端、平板端和整···

Anysphere 推出 Cursor Web 与移动端助力随时随地智能编程

2025 年 6 月 30 日，AI 编程工具 Cursor 的开发公司 Anysphere 正式上线了 Cursor 的 Web 版本及 Progress···

苹果发布《欧盟地区应用更新》，开放应用商店外购买路径

6月26日，当地时间，苹果在开发者官网推出一份名为《Updates for apps in the European Union》的政策文件，···

昆仑万维开源 Skywork‑Reward‑V2，强化 RLHF 训练能力

7月4日，昆仑万维发布了第二代奖励模型系列 Skywork‑Reward‑V2，并同步开源。这次推出了8款从6亿到80亿参···

AVEVA中国智能创新中心成立，聚焦工业AI与数字孪生

7月2日至4日，AVEVA（剑维软件）在宁波举办用户大会期间，宣布成立首个中国智能创新中心。这不仅是其“在中···

字节跳动开源 Trae‑Agent，迈向智能编程自动化新时代

7 月 4 日，字节跳动正式将其 AI 原生 IDE 核心组件 Trae‑Agent 开源，吸引开发社区关注。Trae‑Agent 是一···

江苏明确：县级以下不得再开发政务服务APP

6月底，江苏省发布了一则相当“接地气”的政策：县级以下单位今后禁止新开发政务服务APP，已经做了的，也得···

中央网信办“清朗·整治AI技术滥用”专项行动取得阶段性成果

6月下旬，中央网信办通报了“清朗·整治AI技术滥用”专项行动的阶段性进展。自4月启动以来，这项行动重点打···

工信部通报57款App及SDK侵害用户权益，责令整改

6月26日，工信部发布了最新一轮通报，点名了57款存在违规收集和使用个人信息问题的App和SDK，要求限期整改。···

百度文心快码发布行业首个多模态、多智能体协同AI IDE

6月23日，百度在AI开放日上发布了文心快码的全新版本，带来了一个独立的AI原生开发环境工具——Comate AI I···

百度正式开源文心大模型4.5系列模型

6月30日，百度官宣文心大模型4.5系列全面开源。这次一口气放出了10个模型，覆盖了47B和3B参数的混合专家（M···

更多

I NEED TO BUILD WEBSITE

我需要网站建设