移动互联网

大模型生态布局,阿里云又一次走在了最前面

2023/7/11 13:37:00

“大模型是绝对的主角。”

7月7日召开的世界人工智能大会(WAIC 2023)上,参会者们发出了共同的感慨。

本届大会上,30多个大模型集体亮相,多项AI成果接连展出。各家企业都对自身模型的迭代情况做了更新,应用层面关于“通用”与“垂直”的不同范式研发,也有相应的案例呈现。

军备展示之外,阿里云谈起了一些更宏远的思路。

CTO周靖人表示,阿里云将以促进中国大模型生态的繁荣作为阿里云的首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。

简言之,就是不仅要精进自己的大模型产品,还要提供工具与平台,吸引更多参与者,共建大模型生态。

从千问到万相

多模态处理能力一直是衡量人工智能技术水平的关键指标。继通义千问、通义听悟之后,阿里云发布了AI绘画创作大模型通义万相,进一步完善其通义大模型体系。

通义万相首批上线三项功能:文生图、相似图生成、风格迁移。

基础的文生图功能通过提示词框定创作范围,可根据文字内容生成各类艺术风格的图像。更具独创性的相似图片生成功能,可在用户上传任意图片后进行创意发散,生成内容、风格相似的画作。风格迁移则是对图像分析的进阶诠释,用户上传原图和风格图,可自动把原图处理为指定的风格图。

对于美术相关从业者而言,图生图功能解决了一些日常工作流程中的具体问题,比如批量复制和按需定制。根据现有图像素材批量生成相似素材,可以省略文字转译的过程,直接从图像逻辑出发形成工作流。

按照指定的风格处理图片,同样能节省大量归纳、描述、复刻的时间成本,尤其是在生成概念图,为使用者提供风格参考的场景中,风格迁移功能有巨大的应用空间。

据阿里云介绍,通义万相令人惊艳的能力源于阿里研发的组合式生成模型Composer。

Composer提供了一种新的生成范式,在保证合成质量与创造性的同时,允许灵活控制输出特征。正如名字“compose”所提示,该模型以“合成性”为核心思想,通过将图像拆解多个代表性元素如配色、布局、风格,再以这些元素训练拓展模型,进而重组合成为输出内容。

这种“有限方法的无限使用”除了有效提高生成的可控性,还能保证生成的丰富程度,在“拆解与合成”中输出大量极具创造力的图像,且仅需一个模型即可支持多类图像生成类任务能力。

从文字到语音再到图像,阿里云的大模型产品开发沿着媒介演进逻辑,思路逐渐清晰。

通义万相的问世,意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力,可以更全面地理解和处理信息,提高模型系统的表现和效率。

大模型的“工具思维”

有算力,有模型,阿里云还想要更进一步,有生态。

大模型生态,指向一个完整的体系,包括模型开放与训练、模型部署与推理、数据集与数据处理、相关技术工具,以及产品化落地等多个层面。

为了整合体系,充分释放大模型在生产实践中的智能化能力,阿里云正在搭建一套工具系统,梳理应用逻辑,同时满足“优质”与“易用”。

作为业内最早布局大模型的科技公司之一,阿里云早期的战略规划已被现实证明其前瞻性。

2022年底,阿里云首次提出MaaS(Model as a Service,模型即服务)理念,而后ChatGPT亮相、大模型爆火,MaaS已成行业共识。

如今,阿里云正在将这套以AI模型为核心的云计算技术和服务架构,向大模型初创企业和开发者全面开放。

我们可以从AI模型开源社区魔搭(ModelScope)中,看到生态繁荣的一个侧面。

阿里云发起魔搭社区,旨在为泛AI开发者提供灵活、易用的一站式模型服务产品,让模型应用更简单。

魔搭社区现已聚集了180多万AI开发者和900多个优质AI模型,贡献者涵盖百川智能、哔哩哔哩、IDEA研究院等国内大模型赛道核心玩家,核心玩家累计贡献了超过30个参数超过10亿的大模型。

共享社区汇集了行业领先的模型以方便开发者查找使用,能快速验证模型效果,有效减少重复研发成本。

为了进一步降低大模型使用门槛,阿里云还在本次大会推出了一款智能工具魔搭GPT(ModelScopeGPT)。

用户发出指令后,魔搭GPT通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。

作为国内首款大模型调用工具,魔搭GPT现已能够调用魔搭社区十多个核心AI模型的API,并且随着魔搭社区影响力的扩大、更多模型API加入,魔搭GPT的能力还会不断增强。

依照阿里云的共享共建逻辑,这款工具的数据集和训练方案同样也将对外开放,开发者可以自行调用,按需对不同的大模型和小模型进行组合。

开发者生态的欣欣向荣的背后,是基础设施和模型能力的不断迭代与沉淀。

谈模型必讲算力,阿里云拥有国内最强的智能算力储备作为基础设施支持。阿里云的智算集群可达最大十万卡GPU规模,能承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。

在AI平台层,以机器学习平台PAI为核心的PaaS服务可支持万卡的单任务分布式训练规模,覆盖全链路AI开发工具与大数据服务,AI训练效率提升可达10倍,推理效率提升可达6倍。

此外,阿里云还通过推出开放的灵积模型服务平台,让云服务起到串联枢纽的作用。灵积平台建设了一系列自动化的模型上云统一工具链路,支持模型的自主接入,让所有接入灵积平台的模型都能自动获取平台的强大服务能力。通过灵积,模型不仅能借助推理API被集成,也能利用训练微调API实现模型定制化。

不同层面的工具与服务之间也有联动与协作,当前,魔塔社区已经打通了与灵积平台的部署链路,支持社区的模型通过灵积来实现服务化。

一个模型的“自由市场”蓝图正在阿里云的策划中展开,手持工具的参与者们得以大胆施为,共同探索模型的应用场景和商业化模式。

生态之必要

大模型热潮持续半年,各家都在专注提升自我以应对激烈竞争的当下,为什么阿里云谈起了生态建设?我们或许可以从真实的市场环境中找到一些线索。

一位AI相关行业资深猎头告诉《银杏科技》,大模型的火热对人才市场的影响巨大,AI创业潮爆发,技术岗位需求陡增、高端人才高薪难求,但与之对应的供给侧却显得过分冷静。

“AI人才可能会选择在大厂之间跳,但整体的人才流动频率其实不高,因为大家都觉得只有大厂在频繁更新技术研发进度,中小型公司和创业公司的模型应用能力实在太不确定,很难估测公司未来发展前景如何、与个人规划是否一致。”

简言之,就是用的人还是太少,没有真正盘活市场。

尽管头部企业已经在算力、模型能力、产业结合层面角逐过一轮,但当视角放到落地层面,离大模型普惠应用还存在距离。国内能自研大模型开发产品的公司是极少数,多数创业公司会选择与提供通用大模型服务的厂商合作。

在此条件下,模型能力、使用成本、垂直领域的理解力、与公司具体业务的适配程度、安全性等等因素多有掣肘,模型使用门槛仍旧横亘在前,参与基数不足,便很难真正实现改造生产生活实践。同样也就不难理解对应人才市场在看似火热的大环境下表现出的格外谨慎。

这也是阿里云在此间提出生态理念、推广MaaS的原因。如阿里云CTO周靖人所言,阿里云的定位并非单纯的“大模型开发者”,而是以云服务商身份,通过提供工具与服务,降低使用门槛,阿里云要为大模型创业公司提供全方位服务,促进中国大模型生态意义上的繁荣。

毕竟对于高新技术,只有整体性的前进与突破,才能充分激发市场活力,在全新的技术实践中看到确切的未来。

版权声明
本文仅代表作者观点,不代表贝塔立场。本文系作者授权贝塔专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。

扫一扫,或长按识别二维码

关注贝塔网官方微信公众号