首页 资讯 正文

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

体育正文 40 0

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

“星汉灿烂,若出其里。”人工智能迈入闪耀时刻(shíkè)。 4月29日,习近平(xíjìnpíng)总书记来到位于徐汇区的上海“模速(mósù)空间”大模型创新生态社区调研。他指出,人工智能技术加速迭代,正迎来爆发式发展(fāzhǎn),上海要(yào)总结好以大模型产业(chǎnyè)生态体系孵化人工智能产业等成功经验,加大探索力度,力争在人工智能发展和治理各方面走在前列,产生示范效应。 如今,徐汇区已形成“北斗列阵”+“群星闪耀”的AI生态布局。其中(qízhōng),“北斗七星”由稀宇科技、商汤科技、阶跃星辰、无问(wúwèn)芯穹、星纪魅族、特赞科技和斑马智行7家标杆企业(qǐyè)构成。 这些企业何以成为“北斗(běidǒu)”?它们在人工智能领域有哪些探索和前瞻性的(de)思考?澎湃新闻推出“北斗专访”系列报道,通过(tōngguò)深度对话,解码标杆企业的AI星辰版图。 作为企业掌舵人,清华大学电子工程系毕业夏立雪身上带有理工科学生的(de)气质。如今他的身份是无问芯穹CEO,常穿(chángchuān)公司文化衫或西装出席公开场合(gōngkāichǎnghé),每次采访均准时现身。 面对澎湃新闻记者的提问,他总会迅速(xùnsù)作答,有问必答、条理清晰,即使谈及激烈而(ér)残酷的竞争,也保持平和而克制的语调。 来到上海(shànghǎi)发展,这个出生于1991年的青年企业家开始喜爱这座城市。“上海确实让我有很大的一个感触,它和年轻人是(shì)很匹配的。我们公司(gōngsī)平均年龄32岁,年轻人喜欢(xǐhuān)上海,可能因为它的文化基因更加开放和活泼。” 无问芯穹至今成立刚满两年,融资近(jìn)10亿元。接下来要不要上市,夏立雪(xiàlìxuě)似乎并不心急。他说:“我相信只要坚持做好(zuòhǎo)两件事,既有技术的持续领先,又有商业化(shāngyèhuà)的成功,上市只是一个水到渠成的事情。” 无问芯穹,位于上海徐汇(xúhuì)滨江模速空间一楼。受访者 供图 摆在眼前(yǎnqián)的,是AI竞争来到“深水区(qū)”。2025年,大模型在算力上的比拼正发生深刻转变(zhuǎnbiàn):从原来的“比谁有更多GPU”,演变成了“比谁能更聪明、更经济地用好手中算力”。 “我们现在需要考虑的(de)是,在算力资源(zīyuán)有限的情况下(xià),怎么去解决模型持续增长的问题?”在夏立雪看来,AI的任务越来越多样,芯片技术越来越细分,算力资源越来越紧张——于是,“用最(zuì)适合的芯片做最适合的任务”就成了大趋势。比如(bǐrú),适合训练的芯片专注训练,适合推理的芯片完成推理,适合端侧的芯片负责(fùzé)部署。更重要的是,要发挥异构算力资源的整体效能。 无论对中国还是全球,整合多元异构算力已不再是权宜之计,而是(érshì)技术演进、成本压力和应用多样化之下的一个必然方向(fāngxiàng)。 2025年5月,上海模速空间,无问芯穹公司门口(ménkǒu)。澎湃新闻记者 李佳蔚 图(tú) 中国(zhōngguó)算力资源(zīyuán)的一大突出特点是多元异构。市场上主流CPU生态有5种(zhǒng)以上,GPU生态则多达10种以上,不同的算力芯片、服务器形态(xíngtài)、存储形态,以及网络形态组合配置在一起,可以形成成百上千的组合。 “没有用(yòng)不完的英伟达GPU,也不是必须用英伟达的GPU。”夏立雪说,AI企业如今(rújīn)更(gèng)关注“用对芯片”,而非“用贵芯片”。掌握(zhǎngwò)整合多元异构算力的核心技术,是中国确保人工智能安全、可靠、可控的一部分。 他进一步谈到,“打开水龙头,我们(wǒmen)可能不知道水是(shì)从哪个水库过来的(de),只知道它是标准化的自来水。同理,作为算力运营商(yùnyíngshāng),我们要调用不同的基座模型、使用不同的算力芯片,最终为AI企业提供标准化的算力服务。” 澎湃新闻:这两年大(dà)模型(móxíng)技术更迭非常快,每年都有新焦点,你对行业变化有什么感受? 夏立雪:这两年人工智能发展飞速变化,前年我们在(zài)讨论大语言模型,去年多模态已经进入视野,今年的推理模型大家(dàjiā)也习以为常了,技术飞快地迭代。随着模型能力增强(zēngqiáng),背后是模型的体量增大。 人工智能依然遵循Scaling Law(尺度(chǐdù)定律),对算力(duìsuànlì)的需求越来越大,大到了一个什么程度(chéngdù)?大到了你不能再假设(jiǎshè)(jiǎshè)你的资源是无限的。前两年(liǎngnián)训练模型的时候,很多大厂有一个基本假设,算力是无限的,至少在做单一任务时算力是无限的。但是,现在这个假设的边界已经逼近,我们需要考虑,中国的算力资源是有限的,怎么去解决模型持续增长的问题? DeepSeek提供了一个很(hěn)好的例子,它没有用“大力出奇迹”的方式,而是用低成本、高效率(gāoxiàolǜ)的方式,在资源(zīyuán)有限的情况下造(xiàzào)出了一个好模型。所以,在打造更好的模型方面,现在我们需要更加精细化地把现有算力资源用好。 另外,我们(wǒmen)还要考虑供需关系的问题。比如(bǐrú),当很多算力资源被用在模型训练上,而推理落地的算力需求也在上升,那后者(hòuzhě)的资源就有限了。这中间,算力资源的供需匹配和性价比是一个很大的挑战。 当前,我们特别需要把没有(méiyǒu)被用起来的算力资源充分利用,同时要确保使用效率高。如果你拿来的算力不好(bùhǎo)用,大(dà)模型跑得非常卡,三秒才出一个字,那没人愿意用。 2025年5月,上海模速空间,无问(wúwèn)芯穹办公空间一隅(yìyú)。澎湃新闻记者 李佳蔚 图 澎湃新闻:算力资源有限,是中国特有的(de)还是全球性问题? 夏立雪:大多数国家都面临这个问题,只是有些国家会(huì)选择放弃。在(zài)AI大模型的赛道上,目前来看主要是中国和美国仍在坚持(jiānchí),随着模型不断增大,都会面临算力资源有限的瓶颈。 澎湃新闻(xīnwén):你提到算力供需错配,这是怎么回事?这个市场痛点(tòngdiǎn)如何解决? 夏立雪:现阶段,算力市场的(de)(de)供需错配是比较明显(míngxiǎn)的。举个简单例子,由于(yóuyú)使用(yòng)习惯问题,大家都优先选择所谓的高质量算力,最尖端的GPU,它经过市场验证,一定好用。但问题是,每家企业都需要用尖端卡吗?对性能要求不高的企业,用一般(yìbān)性能的GPU行不行?不同企业需求不同,可以用不同的卡。如果所有企业都抢最尖端的卡,一方面成本极高,另一方面资源很快短缺。 事实上,市场上还有大量性能不错,但没有被关注或接受的算力,我们要让这些算力都(dōu)被利用起来。这当中要解决一些问题,比如,这种算力和模型(móxíng)是不是适配(shìpèi),企业会(huì)不会用。异构卡(kǎ)出于不同的设计理念,会有很多性能差异,适配不同的任务,因此多种不同类型的卡展现出的效率差异会导致大规模分布式训练变得低效。 我们有一个(yígè)公式,AI模型的算力=芯片(xīnpiàn)算力×优化系数×多元异构能力。其中,优化系数是通过软硬件协同发挥(fāhuī)芯片算力最大价值的能力;多元异构,则是让不同类型的算力资源都进入(jìnrù)算力池,并实现算力适配的能力。 打开水龙头(shuǐlóngtóu),我们可能不知道水是从哪个水库过来的,只知道它是标准化的自来水。同理,作为算力运营商,我们要调用不同的基座模型(móxíng)、使用不同的算力芯片(xīnpiàn),最终为AI企业提供标准化的算力服务。 2025年5月,上海模速空间,无问芯穹(xīnqióng)成立2周年的一处照片墙。澎湃新闻记者 李佳蔚(lǐjiāwèi) 图 澎湃新闻:既然AI任务变得越来越多样化,芯片(xīnpiàn)技术(jìshù)也越来越细分,是不是意味着算力应该用在最适合它的地方? 夏立雪:是(shì)的,企业手里(shǒulǐ)有算力,一定要把它(tā)用好。算力需求本身是分层的,供给也应该分层。一些芯片更适合承担大(dà)模型训练的高吞吐任务,另一些则在低延迟、低功耗的推理场景中更有优势,还有些专为端侧部署设计(shèjì),追求轻量化,实时响应。不同类型的AI应用,匹配最适合的算力资源,才能在性能、效率与成本之间找到最优解。 澎湃新闻:能否解释一下,在庞大的AI产业当中(dāngzhōng),你们具体提供怎样的产品和服务(fúwù)? 夏立雪(xiàlìxuě):就像刚才说的(de),我们有点像一个“自来水厂”,从不同水库调取水源,经过统一标准化的处理,再供给到千家万户。我们也(yě)像是大模型算力的电商平台(píngtái),你要部署AI应用,可以像在电商平台上购物一样,在我们这里选择不同芯片、不同模型,选购最适合自己的组合套餐(tàocān)。最终(zuìzhōng),我们希望让更多的企业能用得起算力,也用得好算力。 目前,无问芯穹拥有全球首个可进行单任务千卡规模(guīmó)异构芯片混合训练的平台,支持包括华为昇腾、天数智芯、沐曦、摩尔(móěr)线程与(yǔ)AMD、NVIDIA六种异构芯片在内的大(dà)模型混合训练,集群算力利用率最高可达97.6%。 澎湃新闻:你是清华博士,也是“90后”,你怎么看如今越来越多的科学家和年轻人(niánqīngrén)投身(tóushēn)AI行业? 夏立雪:这两个问题在人工智能行业是(shì)有统一性的。也就是说(yějiùshìshuō),科学家创业(chuàngyè)和年轻人创业,在人工智能行业很普遍,也很匹配。人工智能是一个快速迭代的技术体系,现在很多技术都来不及写书、来不及成为教材(jiàocái),就已经被广泛应用(yìngyòng)起来了。和传统上我们先在学校学习,然后才进入行业应用的模式非常不同。 我(wǒ)们公司平均年龄只有32岁,比我更小,如果算上实习生,那平均年龄才28岁。2023年我们公司推出的第一个在(zài)业界打响名气的推理加速方法FlashDecoding++,通过异步方法实现注意力计算(jìsuàn)的真正并行,它就是一个年仅24岁的实习生作为主要贡献者实现的,那年(nànián)她也拿到了我们公司最高荣誉“无穹之星”。所以在这个(zhègè)行业(hángyè),年轻人大有可为。 澎湃新闻:来到(láidào)上海,你对这座城市以及这里的人工智能发展(fāzhǎn)环境有什么感受? 夏立雪:北京、上海都是人工智能很强的城市,有各自不同的优势。上海确确实实让我有很大的一个感触(gǎnchù),就是它和年轻人(niánqīngrén)的匹配,可能因为它的文化基因(jīyīn)更加(gèngjiā)开放、更加活泼,年轻人生活工作在其中比较舒适。这种环境既有利于创新,也吸引了大量人工智能企业的聚集。 澎湃新闻(xīnwén):无问芯穹是否有融资压力,考虑上市吗? 夏立雪:我们有(yǒu)自己的技术理想(lǐxiǎng),同时也考虑(kǎolǜ)商业化落地。从公司发展角度(jiǎodù),一方面我们会继续坚持(jiānchí)一套自主、可控(kěkòng)的技术方向,符合且服务国家需求;另一方面,我们不是一家研究院,我们乐于追求商业价值,不仅仅是给股东交答卷,更是要让技术接受市场的验证。我相信只要坚持做好两件事,既有技术的持续领先,又有商业化的成功,上市只是一个水到渠成的事情。 澎湃新闻:无问芯穹是首批入驻模速空间的(de)企业,讲一个(yígè)你对模速空间的深刻印象吧。 夏立雪:我们(wǒmen)(wǒmen)公司和(hé)模速空间共同成长,感情(gǎnqíng)很深。模速空间为我们提供了全方位(quánfāngwèi)的贴心服务,并给予了大力支持。这里聚集了大量人工智能上下游企业,我经常上楼找其他同行聊一聊天,相互交换一些行业早期的信息和判断,这对各自发展都(dōu)有好处。另外,我们很多合作也是这样达成的,有时模速空间两家企业相互合作,有时我们携手去服务外部的另一个客户。在这里,机遇非常多。 澎湃(pēngpài)新闻高级记者 李佳蔚 (本文来自澎湃新闻,更多原创资讯(zīxùn)请下载“澎湃新闻”APP)
北斗专访|无问芯穹夏立雪:如今更关注“用对芯片”而非“用贵芯片”

欢迎 发表评论:

评论列表

暂时没有评论

暂无评论,快抢沙发吧~