10月31日,2023云栖大会现场,阿里云正式发布千亿级参数大模型通义千问2.0。同时,阿里云发布了基于通义大模型训练的8大行业模型和一站式大模型应用开发平台阿里云百炼,并透露阿里云上超过30款云产品已接入大模型能力,云产品全面AI升级。
阿里云表示,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,综合性能超过GPT-3.5,正在加速追赶GPT-4。目前,通义千问的APP版本在各大手机应用市场正式上线。
阿里云新发布的8大行业模型则面向不同的垂类场景,分别是通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。
阿里云CTO周靖人在接受媒体采访时表示,众多通义千问产品的发布并不意味着阿里云要去做ToC的产品,而是更多希望借此把模型的能力开放出来,能够让更多的开发者、合作伙伴去使用。他提到,一些开发者由于技术背景或时间成本等原因,会更需要一些能够快速使用的模型接口,阿里云发布的系列产品更多是对准这类需求。
谈到阿里云百炼,周靖人表示,该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。同时,为了保证大模型训练的稳定互联和高效并行计算,阿里云全新升级了人工智能平台PAI。
而在云产品的AI升级方面,记者了解到,阿里云上有超过30款云产品已接入大模型能力。例如阿里云大数据治理平台DataWorks新增了全新的交互形态——Copilot,用户只需用自然语言输入即可生成SQL(结构化查询语言),并自动执行相应的数据ETL操作,整体开发与分析可提效30%以上。“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”周靖人表示。
云栖大会现场,阿里云还宣布了一项“云工开物计划”,要给中国所有大学生每人送一台云服务器。阿里云将为签约高校提供更大规模的算力资源支持。
阿里云透露,目前,中国有一半大模型企业跑在阿里云上,280万AI开发者活跃在阿里云魔搭社区上。“促进中国AI生态繁荣,是阿里云的首要目标。阿里云将坚定打造AI时代最开放的大模型平台。”周靖人表示。