昆仑万维发布并开源Skywork-R1V 3.0

第06版：信息通信

放大+ 缩小- 默认o

昆仑万维发布并开源Skywork-R1V 3.0

本报讯 7月9日，昆仑万维宣布推出最新的Skywork-R1V 3.0版本。据昆仑万维介绍，Skywork-R1V 3.0在后训练阶段通过强化学习策略深度激发模型的跨模态推理能力，在复杂逻辑建模与跨学科泛化方面实现双重飞跃。目前，昆仑万维已全面开源Skywork-R1V 3.0的所有资源，旨在推动多模态推理社区的进一步发展。

Skywork-R1V 3.0基于上一代推理模型Skywork-R1V 2.0蒸馏数据进行“冷启动”，通过拒绝采样构建高质量多模态推理训练集，指导开源视觉大模型InternVL-38B（38B 参数）学会多模态推理的基本格式和方法。随后它引入强化学习算法GRPO（Group Relative Policy Optimization）深度激发模型的推理潜能，实现推理能力在图像和文本模态之间的迁移，显著提升其跨模态、多学科场景下的理解与分析表现。

据介绍，Skywork-R1V 3.0仅依赖约1.2万条监督微调样本和1.3万条强化学习样本，便实现高效训练，充分体现了“小数据激发大能力”的优势。

在性能方面，该模型在综合性多模态评测MMMU中取得了76.0的开源模型最高成绩，超越了Claude-3.7-Sonnet（75.0）和GPT-4.5（74.4）等闭源模型，逼近人类初级专家水平（76.2）。同时，Skywork-R1V 3.0在视觉推理相关的EMMA-Mini（CoT）、中小学知识点测评集MMK12中，均超过规模参数更大的Qwen2.5-VL-72B-Instruct、InternVL3-78B等开源模型。此外，该模型在2025年高考数学新一卷上取得了142分的成绩。

昆仑万维表示，Skywork-R1V 3.0是昆仑万维多模态模型体系的关键节点与核心基石。它不仅能够胜任数学、物理等传统理工科推理任务，在地理、历史、人文、医学、艺术、商业、工程等领域同样表现不俗。Skywork-R1V 3.0在多个测试中的出色成绩，标志着开源多模态大模型在复杂跨学科推理任务上迈上新高度，为教育、科研、医疗、设计等专业领域的AI应用提供了坚实的技术基座。（智言）

放大+ 缩小- 默认o