▶ 本报记者 李洋
最近,“百模大战”的风向转向了开、闭源的争论上。
百川智能CEO王小川在6月14日举行的2024智源大会上表示,开源在市场上有需求,百川在2023年6月开源了第一版,9月开源了第二版,开源体现了一种心态,开源并没有削弱百川的商业竞争力。而百川果断地作出了开源决策,不仅符合市场预期,也为公司赢得了声誉。
一直以来,业界开源大模型与闭源大模型的辩论交锋激烈,百度CEO李彦宏就曾多次表示,大模型开源意义不大,闭源模型在能力上会持续地领先,而不是一时地领先。
从长期来看,差异化的发展路线,将会对各自带来哪些影响?
开源:有利于商业模式的构建
近日,阿里云发布开源模型Qwen2-72B。据阿里云介绍,本次开源的Qwen2-72B大模型在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的开源模型,包括阿里云在4月底开源的Qwen1.5最大的模型Qwen1.5-110B。
目前所有用户都可以在阿里旗下的AI模型社区魔搭社区和开源平台Hugging Face上免费下载开源模型Qwen2-72B。
在Qwen2发布后,Hugging Face联合创始人兼首席执行官Clement Delangue也很快在社交平台X上发帖表示,其开源大模型榜单迎来了新的第一。
猎豹移动董事长兼CEO、猎户星空董事长傅盛认为,开源社区的大模型能力会超越闭源,这背后的原因就是开源并不是简单地做雷锋,而是结合自己的商业模式,结合能够形成社区的反馈能力的一套战略部署。
有关开源大模型与闭源大模型的讨论引起了业界的广泛关注。
通信业知名观察家、中关村信息消费联盟理事长项立刚在接受记者采访时谈到,开源大模型,可以使得更多的用户能够参与进来,成为开发者。但这也使得系统变得相对臃肿,如何确保开发者这些多样化的贡献能够高效整合,形成一个高效且完善的应用,便成为了一个问题。
“比如,模型的质量控制、维护和支持的稳定性就是一个挑战。”易观分析研究合伙人陈晨表示,由于开源模型计算成本的降低,能够吸引开发者构建更多应用,灵活应用于各行业或端侧垂类场景中,并且有利于技术的传播与普惠,于整个行业而言是推动应用创新的重要力量。
“但是,由于数据获取能力和渠道的差异,开源模型的数据集规模可能会受到资源、隐私合规等限制。”陈晨分析,从商业模式看,开源模型可以快速渗透市场,减少推广成本,但仍需要构建更加多元化的商业策略。“实现创新的有效转化,产品化能力是关键要素。此外,还需要关注社区建设、开放标准、安全合规以及持续的质量保证等方面的能力。”
闭源:筑牢技术底层的保障
“开源模型会越来越落后”。5月15日,百度还发布公告称:“闭源大模型+公有云”已经成为全球AI市场的主流趋势。“闭源大模型+公有云”能实现比开源大模型性能更好、成本更低的综合效果,并以此促进AI应用生态繁荣。
实际上,有关开源还是闭源的分歧,国际上也存在,OpenAI的GPT-4模型就是采用闭源模式,而Meta选择完全开源。其余大模型公司则将模型“低配版”开源,更高参数量的模型闭源。
业界人士表示,闭源大模型是一个相对封闭的系统。除了底层的架构外,大量的业务应用和各种接口都经过精心设计和优化,因此管理和调用起来相对更为便捷。
项立刚认为,依赖别人开源的大模型来开发一流的应用或模型,难度是非常大的。“相比之下,封闭系统的开发,虽然要求更大的投入和更高的技术能力,但这样做能够确保对底层架构的深入理解和掌握,从而实现更高的效率和更强大的能力。”
陈晨表示,闭源模型可以在一段时间内保持独特的技术优势,帮助大模型厂商在不同的垂直行业形成领先地位,这依赖于其产品化封装与解决方案能力,大模型能力抽象化与API易用性等一系列的服务支持。另外还需要大模型厂商持续的投入与迭代,相对封闭的模式也更加需要依靠内部力量创新,十分考验厂商投入的专注度与核心人才情况。
找准定位的发展路线
才是最好的
“对于企业来说,可以根据自己不同的情况去选择发展路线,很难说哪一种更好。”项立刚说。
陈晨分析认为,开、闭源路线的选择一方面来自厂商战略目标、市场需求、资源能力等因素的综合考虑,另一方面也来自大模型厂商自身商业化策略的考量。“我们会看到,赛道内率先建立优势的厂商大多会采取闭源,希望通过高质量产品和服务来保持市场的领先地位;后发者则更倾向于开源,希望通过广泛采用和社区合作来快速扩大市场份额。”
陈晨分析说,在需求端,行业头部用户需要模型具有更高的稳定性、安全性和定制化的服务支持,往往更倾向于使用闭源模型,或者是利用开源模型进行增量训练与微调,核心目的都是要构建企业的专属模型。而大多数企业则看重开源模型的灵活透明且成本较低的特性,可能会选择采购或者利用开源大模型API,利用向量化方式优化自身应用。
“行业和企业在平衡创新与知识产权保护的同时,如果能在开放生态的前提下,实现开源和闭源的良性互动,并且在利用开源技术的同时,采取有效措施应对挑战,例如通过加强开源项目的质量控制和安全保障,建立技术联盟制定统一标准和规范,探索不同类型的商业模式等,将有利于共同推动行业健康发展。”陈晨表示。
“大模型持续发展的生态应该从多个方面进行维护,包括促进学术交流和社区的发展、加强技术合作和共享、推动标准的制定和实施等。”传播星球APP联合创始人由曦说。