2024年05月27日
第A3版:热点

大模型:降价还是不降价?

  通过备案的117个大模型地域分布示意图  数据来源:国家网信办

  ▶ 本报记者 张伟

  短短几天,炙手可热的大模型就卷起来了,焦点集中在免费与降价上。

  “擂台赛”打响

  5月22日,腾讯云公布全新大模型升级方案。

  主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费。

  混元-standard API输入价格从0.01元/千tokens降至0.0045元/千tokens ,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%。新上线的混元-standard-256k,具备处理超过38万字符的超长文本能力,API输入价格下调至0.015元/千tokens,下降87.5%,API输出价格下降至0.06元/千tokens,下降50%。

  最高配置万亿参数模型混元-pro,API输入价格从0.1元/千tokens降至0.03元/千tokens,降幅达70%。

  当日,讯飞星火API能力宣布免费开放,讯飞星火Pro/Max API低至0.21元/万tokens。科大讯飞方面表示,在讯飞星火,1token相当于1.5个中文汉字,因此2.1元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。

  5月21日上午,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400,击穿全球底价。

  Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude3  Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元,均远高于Qwen-long。

  当日下午,百度云采取了更激进的策略,直接宣布文心大模型两个主力模型(ERNIE Speed和ERNIE Lite)将全面免费。这也意味着大模型迈入免费时代。

  正方:降价有理

  业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

  “作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”在5月21日阿里云武汉AI智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示。

  刘伟光认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式。

  首先,公共云的技术红利和规模效应,带来巨大的成本和性能优势。阿里云可以从模型自身和AI基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

  即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。

  其次,云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。

  第三,云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

  “目前大模型赛道还处于能力爬坡的过程中,腾讯云非常重视技术积累与客户体验,未来会持续为客户提供有竞争力的产品和服务。”腾讯方面表示。

  反方:降价是双输

  “类似于ofo的疯狂降价是一种双输的策略。”针对这一轮大模型降价,零一万物CEO李开复在5月21日的媒体分享会上表示,未来整个行业的推理成本每年降低10倍,这一点可以期待,也是必然趋势。

  但“大模型公司不会这么不理智,因为技术才是最重要的。”面对激烈的价格战,李开复指出,当大模型团队认定自身的技术价值时,“就会坚持一个合适的价格,而绝不会靠贴钱、赔钱去做生意”。

  另据记者了解,零一万物最新发布的Yi-Large模型的定价是20元100万tokens。李开复坚定地表示,“我们现在还没有调整价格的打算,Yi-Large上线后的反馈是非常正面的,也有很多忠诚的爱好者已经加入,我们先服务好他们。”

  “我们的模型表现超过了其他模型,欢迎友商来 LMSYS 打擂台,证明我是错的。但在那发生之前,我们会继续说我们是最好的模型。”李开复强调。

2024-05-27 6 6 高新科技导报 content_134107.html 1 大模型:降价还是不降价? /enpproperty-->