本报讯 记者宋婧报道:5月9日,记者从阿里云AI智领者峰会获悉,阿里云通义千问大模型升级至2.5版本,模型性能全面赶超GPT-4 Turbo。通义千问最新开源的1100亿参数模型的多个基准测评成绩超越Meta的Llama-3-70B。
据阿里云CTO周靖人介绍,相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循和代码能力分别提升了9%、16%、19%和10%,中文能力领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得中国本土大模型就取得如此佳绩。
同期,阿里云发布了最新款开源模型——1100亿参数的Qwen1.5-110B。据悉,该模型在MMLU、TheoremQA、GPQA等基准测评中均超越了Meta的Llama-3-70B模型,在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上冲到榜首。
此外,通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。
据悉,通义大模型目前API日调用量已经过亿,通义开源模型累计下载量突破700万,在PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域加速落地应用,行业客户包括小米、长安汽车、新东方、同程旅行、完美世界等。