我们已经准备好了,你呢?

2026我们与您携手共赢,为您的企业形象保驾护航!

阿里云搬出通义大模型“全家桶”炸场了!

在昨天的云栖盛会上,通义千问模型成功升级至拥有千亿参数的2.0版本;与此同时,它在10项权威评测中展现出卓越的综合性能,不仅超越了GPT3.5,还在加速接近GPT-4的水平;更值得一提的是,用户可通过通义千问APP亲身体验这一创新;此外,阿里云还慷慨地分享了打造大型模型应用的独门技巧。

此刻,仅需提出问题,依托于阿里云通义构建的代码生成大模型——通义灵码,便能自动生成相应的代码。

只需对它说“请为我编写一款飞行游戏”,片刻之间,它便能迅速生成超过100行代码,仅需直接替换相关参数即可。

通义千问2.0性能评测_阿里云通义大模型全家桶_阿里云主机助手

开发一个大模型应用,最快也只需5分钟就能搞定:

通义千问2.0性能评测_阿里云通义大模型全家桶_阿里云主机助手

在大会的现场,阿里云首席技术官周靖人进一步披露,此次推出的完整产品组合背后,阿里云正对从基础算力到AI平台,再到模型服务的整个技术栈进行全面升级。

已经初步建成AI时代全栈的云计算体系。

目前,众多中国大型模型企业选择阿里云作为其运行平台,同时,在阿里云魔搭社区,有280万AI开发者在此活跃交流。

总之,信息量爆炸,咱们一项一项拆解来看。

千亿参数通义千问2.0来了

先来看通义千问2.0。

这标志着上月底,阿里云发布了开源的通义千问140亿参数版本Qwen-14B,以及其对话模型Qwen-14B-Chat,这是该系列产品的最新进展。

2.0版本的通义千问升级后参数量大幅增加,已达到千亿级别,同时“采用了更为先进的对齐技术”。在10项权威评测中,其表现全面超越了GPT-3.5和LLaMA-2,甚至展现出有望赶超GTP-4的势头。

通义千问2.0性能评测_阿里云通义大模型全家桶_阿里云主机助手

不仅是官网全面更新,多模态和插件都来了。

阿里云主机助手_通义千问2.0性能评测_阿里云通义大模型全家桶

而且就在昨日,各大安卓应用平台均已推出通义千问应用程序,使得用户使用更加便捷;iOS用户们请稍作等待,据悉该应用即将上线。

我们立即进行了实际操作体验,一探究竟,2.0版本究竟实现了哪些显著的功能提升。

我们直接来一道中文十级理解选择题(手动狗头)。

挑选出六个形似度较高的词汇组合,观察通义千问能否从中辨别出差异。

阿里云通义大模型全家桶_阿里云主机助手_通义千问2.0性能评测

一次成功!

通义千问2.0明确指出,B选项里的两个词组所传达的含义并不一致。

抱着“打起来”的心态,这个问题我们也丢给了(GPT-4)。

GPT-4察觉到了一些新的亮点,然而,它却对B选项视而不见,仅对C选项的不足提出了批评。

通义千问2.0性能评测_阿里云主机助手_阿里云通义大模型全家桶

在云栖大会的现场,阿里云官方指出,“通用数学能力”的提升成为通义千问2.0版本的一个重要特点。

那我们也不客气了:

杰森将一块石头投向池塘的水面。石头在池塘的表面连续弹跳了三次。若以第二次弹跳的距离为第一次的一半,第三次弹跳的距离为第二次的四分之一,那么这三次弹跳的总距离为65英寸。请问,石头在第一次弹跳时究竟移动了多少英寸?

这道题曾被知乎网友用来遍问中外大模型,结果和纷纷翻车。

通义千问2.0版本成功通过了考验,其提供的过程简洁明了,所给出的答案也准确无误。

阿里云主机助手_通义千问2.0性能评测_阿里云通义大模型全家桶

记忆与理解能力同步提升,是衡量大模型能否准确把握用户意图的关键要素。

让我们来开展几场多轮对话的较量,检验一下通义千问2.0是否能够准确捕捉并记忆对话中的前后文内容。

通义千问2.0性能评测_阿里云通义大模型全家桶_阿里云主机助手

通义千问2.0迅速打造了一出密室逃脱的剧情,并且为自创的悬疑故事命名,取名为《密室之谜》。

然而,这尚显不足——我们提出了新的要求,即在故事中增加一位新角色,一位名叫肉丝(Rose)的女孩。

观察之下,通义千问2.0并未遗忘其原有的故事框架,并非简单地在段落中强行插入,而是对某些剧情进行了调整,使得肉丝的登场显得更为顺畅自然。

阿里云主机助手_通义千问2.0性能评测_阿里云通义大模型全家桶

总体而言,在处理复杂指令、进行文学创作、运用通用数学技能以及记忆知识等各方面,通义千问2.0展现出了显著的提升,其表现同样出色,毫不逊色。

但通义大模型“全家桶”,还不止如此。

与通义千问2.0版本同期发布的,还包括了8款行业专用的大型模型,这些模型分别针对金融、医疗、法律、编程以及个性化创作等多个领域进行了设计。

通义千问2.0性能评测_阿里云主机助手_阿里云通义大模型全家桶

行业大模型的主要特点,就是更容易在业务场景中被集成。

以通义灵码为例,这一智能编码助手是在为阿里云通义大模型提供大量高质量的开源代码数据集以及编程教材等资源的基础上,经过精心培养和训练而诞生的。

话不多说,依然是实测走起。

该任务涉及日常运维工作中的常规需求,即编制一个脚本,该脚本能够将位于/var/log目录下的所有日志文件进行打包操作,并最终实现将这些打包后的文件上传至oss平台。

起初,尽管通义灵码成功生成了代码,却未遵循“打包”的指令。然而,在我们指出其疏漏后,它迅速对代码进行了修正。

这回的浪潮,是以通义千问2.0为基础,众多大型模型在云栖大会上竞相展示它们的实力。

在行业大模型发布的同时,更为关键的是,阿里云还披露了将大模型实际应用落地的“秘诀”。

阿里云大模型应用秘籍公开

目前,众多行业人士普遍认为,大模型的竞争正迈向新阶段,主要战场正从模型层面转移到应用层面。

因此,除了基础模型之外,阿里云此次还推出了一项备受瞩目的新产品——阿里云百炼,这是一款一站式的大模型应用开发平台。

经过多次锤炼,开发者能够在短短五分钟内打造出大型模型应用,仅需数小时便能炼制出企业定制的模型,从而将更多的时间和精力投入到应用的创新开发之中。

在模型层面,阿里云百炼平台汇聚了国内众多顶尖的大规模模型,包括阿里云自主研发的通义系列模型,以及诸如姜子牙等第三方提供的模型。此外,该平台还允许用户上传并使用他们自行训练的模型。

有趣的是,百炼还推出了一个模型选择的推荐清单,从综合实力、推理水平、语言技能等多个角度出发,哪家模型的优越性一目了然。

功能方面,百炼主要面向两重需求:

为满足用户对定制化模型训练的需求,百炼公司提供涵盖数据加工、模型微调直至评估与部署的全方位服务。该服务支持多种微调技术,如SFT和LoRA等,确保所有训练数据都能实现可视化展示。训练成功后,用户还可轻松实现模型的一键式部署以及性能评估。

为满足那些致力于开发大型模型应用的用户需求,百炼平台助力用户将大模型与具体业务系统深度融合,打造智能的Agent。此平台下的插件中心不仅囊括了官方认证的系统插件,还支持用户根据自身业务需求定制插件,从而有效提升大模型的交互性能。

值得一提的是,在阿里云百炼平台中,特别设立了一个“应用广场”,这里汇聚了众多预先设置的应用模板。

通义千问2.0性能评测_阿里云主机助手_阿里云通义大模型全家桶

我们尝试运用“商品推广文案模板”,轻松搭建了一个专门生成小红书种草文案的小程序,其效果可谓是相当不错:

阿里云通义大模型全家桶_通义千问2.0性能评测_阿里云主机助手

此外,在保障安全层面,阿里云为各类模型配备了基础安全工具包。这意味着用户无需进行额外操作,即可轻松将安全功能融入和部署到他们自主开发的模型及应用之中。

截至目前,央视网络平台、朗新科技公司以及亚信科技公司等一批早期使用者,已经在阿里云的百炼平台上成功创建了各自的特定模型和应用程序。

朗新科技成功在云端培育了针对电力领域的专业大型模型,推出了“电力账单智能解析助手”以及“电力行业政策与数据分析助手”,这些产品显著提升了客户接待效率达50%,并有效减少了70%的投诉率。

央视网培育出了一个针对媒体行业的巨型模型,并推出了内容制作方面的辅助工具。与通用型模型相较,编辑们对所生成内容的满意度及采纳比例均显著提高。

值得关注的是,在加速推动应用落地的过程中,阿里云人工智能平台PAI,作为大模型时代的核心“基础设施”,亦已实现了全方位的升级。

PAI底层技术基于HPN 7.0新一代AI集群网络架构,该架构具备支持10万卡量级集群的可扩展性。其超大规模训练的线性拓展效率提升了96%,这一指标已超越行业平均水平。在执行大模型训练任务时,相同的效果下,PAI能够节省超过50%的算力资源,性能表现达到了全球领先地位。

众多知名企业如百川智能、智谱AI、零一万物、昆仑万维以及vivo,还有复旦大学等学术机构,目前都在阿里云平台上进行大型模型的训练工作。

阿里云通义大模型全家桶_阿里云主机助手_通义千问2.0性能评测

“打造AI时代最开放的大模型平台”

在AI 2.0时代,随着大型模型迈入新的发展阶段,战场焦点已从模型层面转移至应用层面,此时,两大行业内的领军企业展现出了截然不同的两种经营理念与特色。

靠API,Meta靠开源。

不过无论是何种路线,这两家巨头都在以自己的方式繁荣着生态。

为什么要发展大模型生态?

一方面,没有应用层的发展,基础模型的价值发挥就会严重受限。

此外,应用层与模型层的相互促进,以及生态系统中各参与者之间的竞争,共同作用,有效推动了整个大模型领域的质量提升和创新发展。

周靖人在云栖大会的现场,态度诚挚地强调,阿里云的宗旨并非局限于服务单一客户群体,而是期望在人工智能的新时代,向形形色色的企业伸出援手,助力它们在各自擅长的领域开启创业之路。

促进中国AI生态繁荣,是阿里云的首要目标。

在确立目标之后,致力于构建AI领域最为开放的大模型平台的阿里云,其具体实施策略如下:

8月初,开源通义千问推出了70亿参数的模型Qwen-7B;紧接着,基于Qwen-7B构建的大规模视觉语言模型Qwen-VL亮相,该模型能够接受图像、文本、检测框等多种形式的输入;到了9月底,新发布的模型参数量已经达到了140亿,也就是Qwen-14B。

近期,阿里云紧跟“国内大模型开源全系列”的步伐,宣布即将开源一款参数量高达720亿的Qwen-72B模型。一旦该版本模型开源,它将取代现有模型,成为国内参数量最大的开源模型。

在更深入的角度来看,阿里云构建的AI模型开源平台魔搭,自去年推出以来,今年已迅速成为开发者们频繁聚集的场所。

几个数据迅速映入眼帘:短短一年间,下载量超过一亿、AI开发者数量达到280万以上、模型总量超过2300个、……

特别值得一提的是,即便规模庞大、实力雄厚,魔搭社区依然存在许多极具吸引力的优惠机会。

魔搭平台向新用户慷慨提供价值100小时的免费GPU计算资源,每人限领,至今已总计向开发者赠送了超过3000万小时的免费GPU算力。

阿里云主机助手_通义千问2.0性能评测_阿里云通义大模型全家桶

重返现实,大型模型对传统工作流程的颠覆性变革力量,已经在各行各业中引发了一场智能化的全新升级风潮。

当局者方面,“百模大战”的激烈竞争已逐渐落幕,目前我们已步入一个更为冷静、客观、理性的阶段,能够更慎重地挑选出优质的大模型。

从大模型的三个核心要素——即算力、模型以及应用层面来看,目前关键的评价标准正随着各方的努力而逐步显现:更经济高效的算力、更卓越的模型性能、以及更加兴旺的开发者生态环境。

以此为标准,以阿里云的整体布局而言,长期来看确实值得期待。

而且,得益于“开源”这一选择,在当下这个时代,我们无需将自身的命运完全托付于他人。

二维码
扫一扫在手机端查看

本文链接:https://www.by928.com/9761.html     转载请注明出处和本文链接!请遵守 《网站协议》
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。

项目经理在线

我们已经准备好了,你呢?

2020我们与您携手共赢,为您的企业形象保驾护航!

在线客服
联系方式

热线电话

13761152229

上班时间

周一到周五

公司电话

二维码
微信
线