阿里云为什么对大模型持续乐观?

来源:

责任编辑: 袁彧

发布时间: 2024-09-21 07:16:40

0

0

在大模型行业集体迷茫之际,阿里云却在2024云栖大会上释放了诸多积极信号。

大模型走红快两年,目前的发展状态和此前业界的预期还有较大差距,一些大模型公司开始出现战略摇摆。但阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在演讲中表示,过去22个月,AI发展的速度超过任何历史时期。

一方面是大模型技术快速迭代以及技术可用性大幅提升。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。

另一方面,模型推理成本指数级下降,已经远远超过摩尔定律。以通义千问为例,一年来,通义千问API在阿里云百炼上的调用价格下降了97%以上,百万Tokens调用花费最低已经降到了3毛钱,未来还有继续下降的趋势。

吴泳铭给当下大模型发展状态的定义是“AGI变革的早期阶段”,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。在他看来,全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。

从2024云栖大会上的一系列发布来看,阿里云对大模型的乐观不只停留在口号上,而是要继续实打实投入。

阿里云和同行态度的强烈反差,背后是彼此对大模型应用落地前景认知的差异导致的。

大模型的想象空间不只在手机屏幕

大模型太多,应用却太少是当下整个行业面临的问题,大模型要跑起来、更要用起来,需要走好落地应用“最后一公里”。

从各家基础模型公司和应用层公司的探索来看,目前大模型的落地应用分为B端和C端两个方向。

在B端场景中,大模型目前已经在金融、工业、教育、医疗、政务等行业中得到应用,对研发设计、生产制造、经营管理、营销服务业务环节带来一些助力。但整体来看,很多企业对大模型的应用还在探索阶段,大模型依然面临落地难、落地成本高的问题。

C端场景的边际成本更低,被大模型从业者寄予了更多期待。AI助理被认为是大模型时代的超级应用,无论是以月之暗面为代表的大模型创业公司,还是腾讯、字节跳动、百度等互联网大厂,都相继推出了AI助理类应用。但豆包、Kimi等多个AI助手应用的表现还没达到人们的高预期,产品形态依然在演进,暂时看不到移动互联网时代超级应用爆发的势头。

很多从业者对大模型的落地应用感到迷茫,一个重要的原因是他们把对大模型应用落地的场景局限在手机屏幕上。

吴泳铭在2024云栖大会上给出了不一样的答案。在他看来,AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界。

过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

正因为如此,我们更应该跳出移动互联网的视角来看AI大模型的未来。很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

吴泳铭表示,AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。

这样的变革已经在一些行业发生,比如汽车行业。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

在吴泳铭看来,机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。

从这个角度来看,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。AI大模型的价值也不仅仅局限在商业领域,更重要的是将给社会生活带来巨大改变。

这是一个更大的历史机遇,也值得更多从业者积极投入、提前布局。能够抓住这个历史机遇的企业,将释放出比移动互联网高速增长时代更大的价值。

强大的基建才能催生AI新未来

在颠覆式的新浪潮下,坚定的技术乐观派才会真正走在时代前面,引领变革的发生。

在吴泳铭看来,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,很多人会在迟疑中错过。

不同于传统IT时代,AI时代对基础设施的性能、效率要求更高。业界先进的模型参数规模和数据规模仍在持续增长,巨头之争已经从千亿模型向万亿模型发展。

比如,GPT-4模型具有1.8万亿参数,在约 13万亿个Token上进行了训练,算力需求相当于在大约2.5万张A100加速卡上运行90~100天。Meta在原有1.6万张A100卡集群基础上又建设两个具有约2.5万张H100加速卡集群,用来加速LLaMA3的训练。由此可见,万卡已经成为未来先进大模型训练的新起点。

尽管先进模型的门槛提升至几十上百亿美金,但头部大厂在投入上未曾迟疑。在海外,谷歌、微软、亚马逊、英伟达、Meta、苹果和xAI,每年在前沿技术上的投资高达 4000 亿美元,大部分资金都投向大模型和AI基础设施。

国内大厂中,阿里云投入压强最高,AI基础设施、基础模型、对外投资全覆盖。本届云栖上,吴泳铭表示,“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。”

过去一年,阿里云从以CPU为主导的传统计算体系,加速向以GPU为主导的AI计算体系演进,新增算力超50%都是AI算力。阿里云CTO周靖人在演讲中表示,阿里云正在围绕AI时代树立AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

周靖人在2024云栖大会现场展示了阿里云全系列产品家族面向AI的升级:最新上线的磐久AI服务器,并提供AI算法预测GPU故障,准确率达92%;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。

在模型层,阿里云也持续饱和式投入,几乎保持以月为周期迭代基础模型。大会现场,阿里云宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o,同时还发布了开源模型Qwen2.5系列,成为仅次于美国Llama的世界级模型群。

其中,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

今年,大部分大模型厂商都试图通过降低大模型的使用门槛来推动大模型在更多行业落地。得益于基础设施的强大,阿里云在降低企业和开发者使用成本方面也是最积极也是最激进的厂商之一。

今年5月,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long价格直降97%,1块钱即可买200万tokens,相当于5本《新华字典》的文字量。降价后,Qwen-Long价格约为GPT-4价格的1/400,击穿全球底价。

本次云栖大会上,阿里云再次宣布百炼平台上的三款通义千问主力模型大幅降价。Qwen-Turbo价格直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus同等规模较行业价格低84%。

同时,阿里云还在持续坚持开源模型路线。通义大模型一年多来坚持全尺寸、全模态开源,多次登上HuggingFace开源榜首,同时,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,受到开源社区众多开发者的追捧。

从模型服务到AI云服务,阿里云持续投入的强度堪称“中国卷王”,无论行业如何争论,反正开源闭源全覆盖,从底层基础设施到上层的大模型平台和模型社区全栈建设,布局的广度和深度,甚至全球无出其右。

阿里云的乐观和信心来自坚定的信念。少有人知道的是,阿里云从2018年便投入大模型研发,因此能够在ChatGPT掀起新一轮AI浪潮后迅速站稳国内基模第一的身位,而在前年云栖大会上,阿里云即提出MaaS模型即服务的理念,此后引领了全球云厂商面向AI时代的MaaS变革。

如今,阿里云看到的路是,只有提前布局,打造更强的基建,才能让所有人都能用上最先进的大模型,让企业和开发者以最低的成本使用AI,让整个行业更快拨云见日。

新闻热榜

1

泰坠机遇难者为好友

2

美好生活在云南|禾黄稻香鱼儿肥秋收时节景色美

3

填表报数的负担这样减下来(干部状态新观察·为基层减负赋能)

4

博兴农商行城区支行与人社局联办“源来好创业”政策交流宣讲活动

5

记者连线|柯文哲下午召开记者会将交代查账进度

6

韩总统光复节遭批

7

"北约秘书长斯托尔滕贝格发表最新声明!

8

中俄万万没料到!伊朗政坛一夜“大换血”,对美国态度巨变

9

俄罗斯军队推进,乌克兰民众等候离开波克罗夫斯克的巴士和火车

10

平安警色丨江苏张家港公安:全力构建生态文明建设新格局,让“江海交汇第一湾”美如画

11

2024.8.8乌军攻入俄库尔斯克的几大疑点分析#国际新闻

12

2024年中国网络文明大会网络文明培育分论坛发布系列成果

13

六集政论片《解码东北振兴》第四集:端牢能源饭碗

14

第九届“一带一路”高峰论坛将于9月在香港举行

15

洪都拉斯对美国下重手!在美国大使对洪都拉斯和委内瑞拉国防官员会晤表示所谓的“担忧

16

杨兴蓉:让文化“活”起来,才能让城市“火”起来

17

大连一架小飞机迫降公路无人伤亡,所属企业发布声明:飞行中突发故障

18

中美已谈拢,日本做出重大让步,高官紧急访华,岸田政府找台阶下

19

台南真的很绿吗?“学姐”黄瀞莹:民进党弊案频发已引爆民众怒火

20

特朗普支持率下降,美智库亮出对华政策,中方2句话表明态度

21

"印度人掌控美国科技公司,开始危害到中国本土!

22

2024年美国总统大选,三大候选人,到底谁能胜出?

23

让美国失望了?一觉醒来,反华联盟彻底“崩塌”!拜登着急也没用

24

乌军心态被打崩了,南顿涅茨克大势已去,后勤枢纽被俄1天攻破

25

诚信建设取得积极成效!《中国网络诚信发展报告2024》发布

26

国防部:推动中越两军关系迈上新高度取得新发展

27

宋祖英海军"

28

省总工会“强国复兴有我”主题阅读活动举办

29

台风来袭 日本自民党多人推迟宣布参选党总裁

30

基本医保将释放更多红利

31

会谈结果出炉,沙利文做让步,公开承诺,美国不支持“台湾独立”

32

体育总局召开整治体育领域“饭圈”乱象专题工作会

33

大爷偏要跟人“斗桥,7个壮小伙慌了一下,输赢没悬念”

34

最后关头,特朗普彻底没戏了?哈里斯果然不简单!背后真相不简单

35

泽连斯基:俄乌冲突最终将以对话方式结束,但基辅必须占据主动地位

36

中美已谈拢,日本做出重大让步,高官紧急访华,岸田政府找台阶下

37

两岸举办相关活动纪念郑成功诞辰400周年

38

国防部:第十一届北京香山论坛参会人员数量和层级再创新高

39

永州市市场监督管理局调研中国农科院祁阳红壤实验站知识产权产业化工作

40

中荷人寿安徽分公司开展现场教学警示教育活动

20

沙利文访华求帮助,美国如今的现状,印证了毛主席75年前的论断

20

未来三天东北地区雨水较多高温坚守川渝地区

20

湖南这个县撤销了1450个协调机构,有何深意?

20

张昊唯被曝税务问题

20

退伍军人被顶替26年

20

"连撞中美两堵墙后,莫迪认清事实愿出席金砖峰会,但中方未必买账

20

澳大利亚经历该国有记录以来最热冬日

20

关于未成年人,这一重磅报告发布

20

法国组阁“三国演义”:马克龙与左翼联盟针锋相对,极右翼从容不迫

热门攻略

1

石破茂访台回国后,决定参选日本自民党总裁,却面临尴尬

2

让美国失望了?一觉醒来,反华联盟彻底“崩塌”!拜登着急也没用

3

内蒙古红干椒香飘海外公用品牌市场价值达20亿元

4

村里唯一的年轻人出门旅游20天,回村后老人排队来“修”手机:“一般都是没电了,弄到静音了,亮度弄到最低了,对于他们来说就是大问题了。”

5

亲人接连丧命,她愤而退出民进党,“民众要的是一口干净空气”

6

被虐死女童母亲发声

7

柳州市妇幼保健院多措并举优化诊疗服务

8

家人们破防了

9

辟谣民工讨薪被拖走

10

连撞中美两堵墙后,莫迪认清事实愿出席金砖峰会,但中方未必买账

11

青岛市崂山区:坚持把好“三关”推动党费工作提质增效

12

张雨霏拒白嫖中国pin

13

揭秘:普京为何不使用核武器?泽连斯基有话说!

14

宣绩高铁开始试运行全线开通运营进入倒计时

15

2024年中国网络文明大会“网络文艺与文化强国建设”分论坛在成都举行

16

中企在非洲累计参与新建、改造铁路超1万公里、公路近10万公里

17

绕过“豁免权” 检方提交新诉状起诉特朗普

18

2024山西·怀仁羔羊肉交易大会启幕

19

人口老龄化加剧,日本上半年超3万名独居者死于家中

20

四川SUV冲进水果摊

20

我省积极培育建筑业新质生产力2024-08-2906:42:09 [山西新闻] 太原日报 贺娟芳2024-08-2906:42

20

济阳街道矛盾调解:化干戈为玉帛的实践与探索

20

给中国设的局,先让印度吃了苦头,拜登的利刃,先扎到了印度身上

20

拉夫罗夫警告西方别玩火泽连斯基:谁信核威胁

20

拿生命当儿戏?奥地利一医生让13岁女儿操作手术

20

上迪208元雪糕争议

20

红海遭袭油轮大火持续胡塞武装允许救援

20

20天了,还赶不走乌军!普京大怒,中方收到求助信号,中国开始行动

20

美国大选突发意外,民主党“大金主”临阵倒戈,特朗普胜率再提升

20

要想开源节流。少用公款请"

20

张雨霏拒白嫖中国pin

20

沙利文今起访华

20

外媒:西藏存在所谓人权问题,外交部:是中国内政,不容外部干涉

20

美国宣布制裁以色列定居者,内塔尼亚胡很不满

20

杭州第一网红楼不火了

20

跨域融合河北廊坊北三县与北京通州区政务服务全面互通

20

市内免税店政策进一步完善

20

辽宁石油化工大学:以长征精神为引领的育人实践探索

20

2024年版湖南省标准地图发布!有这些变化

20

王毅外长在北京会见沙利文;中美战略沟通,扩大治理范围

20

正部级苟仲文落马三月后,“老下属”出庭受审

20

郑文灿卧室又搜出678.5万新台币,难怪天价保金说交就交

20

2米金箍棒卖180万

20

曾经点燃残奥会主火炬的他们为出征巴黎的残奥运动员加油

20

“第二个”菲律宾已冒头?专家直言太荒谬,外交部警告前所未有

20

以军称在约旦河西岸打死5名巴勒斯坦武装人员

20

哈马斯拒美停火提案

20

秋种忙

热门游戏

  • 1
    河南监狱管理局通报

    射击枪战 /热度:96723

    点击下载

    印度一女子为了与情人在一起,将3岁女儿残忍杀害

  • 2
    美国超级富豪警告:有三条红线,中美不要碰触,不然的话后果自负

    射击枪战 /热度:42082

    点击下载

    郑钦文回应金牌去向

  • 3
    上海市人大常委会原主任董云虎受贿案一审宣判:无期徒刑

    射击枪战 /热度:78798

    点击下载

    刚刚,地震了!泉州有震感

  • 4
    崩坏3 左翼强势“逼宫”,法政坛陷入僵局,关键时刻,马克龙开始耍无赖

    射击枪战 /热度:63531

    点击下载

    巴西对华皮下注射针头启动反倾销调查

  • 5
    原神 北京全市“一本账”,政府资金实现全过程闭环管理

    射击枪战 /热度:31877

    点击下载

    洪都拉斯谴责美国干涉内政宣布终止与美引渡条约

  • 6
    出发吧麦芬 以军在约旦河西岸行动已造成12死26伤

    射击枪战 /热度:91817

    点击下载

    美或无法办下届奥运

  • 7
    永劫无间手游 英国6000万只野鸡泛滥,杀一只就奖励英镑,中国人吃一只却坐牢?

    射击枪战 /热度:22007

    点击下载

    中国有个“特殊”村庄:靠一门过硬技术,吸引美国黑帮前来消费

  • 8
    向僵尸开炮 济宁一地大排量摩托车限行

    射击枪战 /热度:04868

    点击下载

    美国一嫌犯认出法官是老同学后痛哭9年后再犯案两人又相见

  • 9
    鸣潮 放线员大兴安岭失踪

    射击枪战 /热度:93148

    点击下载

    三胞胎都考上一本

  • 10
    艾塔纪元 泼天富贵轮到山西了

    射击枪战 /热度:56503

    点击下载

    说白了就是…别看美国表态不支持这不支持那,他还有一句没说出来…那就是:美国不支持

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 游戏声音设计工作室 | 角色扮演 | 游戏测评 |