本报讯 7月9日,昆仑万维宣布推出最新的Skywork-R1V 3.0版本。据昆仑万维介绍,Skywork-R1V 3.0在后训练阶段通过强化学习策略深度激发模型的跨模态推理能力,在复杂逻辑建模与跨学科泛化方面实现双重飞跃。目前,昆仑万维已全面开源Skywork-R1V 3.0的所有资源,旨在推动多模态推理社区的进一步发展。
Skywork-R1V 3.0基于上一代推理模型Skywork-R1V 2.0蒸馏数据进行“冷启动”,通过拒绝采样构建高质量多模态推理训练集,指导开源视觉大模型InternVL-38B(38B 参数)学会多模态推理的基本格式和方法。随后它引入强化学习算法GRPO(Group Relative Policy Optimization)深度激发模型的推理潜能,实现推理能力在图像和文本模态之间的迁移,显著提升其跨模态、多学科场景下的理解与分析表现。
据介绍,Skywork-R1V 3.0仅依赖约1.2万条监督微调样本和1.3万条强化学习样本,便实现高效训练,充分体现了“小数据激发大能力”的优势。
在性能方面,该模型在综合性多模态评测MMMU中取得了76.0的开源模型最高成绩,超越了Claude-3.7-Sonnet(75.0)和GPT-4.5(74.4)等闭源模型,逼近人类初级专家水平(76.2)。同时,Skywork-R1V 3.0在视觉推理相关的EMMA-Mini(CoT)、中小学知识点测评集MMK12中,均超过规模参数更大的Qwen2.5-VL-72B-Instruct、InternVL3-78B等开源模型。此外,该模型在2025年高考数学新一卷上取得了142分的成绩。
昆仑万维表示,Skywork-R1V 3.0是昆仑万维多模态模型体系的关键节点与核心基石。它不仅能够胜任数学、物理等传统理工科推理任务,在地理、历史、人文、医学、艺术、商业、工程等领域同样表现不俗。Skywork-R1V 3.0在多个测试中的出色成绩,标志着开源多模态大模型在复杂跨学科推理任务上迈上新高度,为教育、科研、医疗、设计等专业领域的AI应用提供了坚实的技术基座。 (智 言)