苹果公开自研多模态大模型进展

第06版：人工智能

放大+ 缩小- 默认o

本报讯据相关媒体报道，近日，苹果公司研发团队发布了一篇论文，首次公布了多模态大模型MM1，展示了该公司在人工智能方面的进展与实力。

据悉，MM1最高参数量为300亿，该模型支持增强的上下文学习和多图像推理，在一些多模态基准测试中有较好表现。MM1的独特之处在于其庞大的规模和架构创新，包括密集的模型和混合专家模型。这些模型证明了研究人员方法的有效性，将大规模预训练与战略性数据选择相结合，以增强模型的学习能力。

该研发团队称，MM1不仅在预训练指标中是“最先进的”，并且在一系列已建立的多模态基准测试中，经过微调后也保持了“有竞争力的”性能。

业内人士分析认为，目前MM1的整体性能还没有完全超过谷歌的Gemini和OpenAI的GPT-4，虽然MM1可能还不是绝对的领导者，但它仍然是苹果公司在人工智能方面的一次重大飞跃。（晓文）

放大+ 缩小- 默认o