大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单

时间:2023-07-06 来源:

但可以看到,10亿级参数这个量级,很可能不是真正的“分界线”。因为现实的情况是,一些未能达到千亿规模的模型,很难在当前市场的竞争具有竞争力。不过,也不排除一些在垂直领域深耕的玩家,最终能跑出来。

“大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单。”夏先生认为,目前来看诸如百度、腾讯、阿里无论是在资源还是积累上,都有一定的优势,“他们在云市场深耕,并在自己擅长的领域积累多年,无论技术层面还是行业积累上,实质已经完成了抢跑,未来就看这些头部玩家如何落地。”

而在投入层面,这会是一个天文数字。

以百度为例。据透露,过去10年,百度在AI方向的投入已超过1000亿元。但大模型不是投一笔钱、做一个模型那么简单,它需要有算力、有数据、有经验丰富的AI工程师在好的研发平台上长期积累。

而创业公司如果直接去做基础大模型,除了上述投入之外,还需要能够把模型、算力管理好的AI开发平台。

这意味着,创业公司不论是自建开发平台,还是采购外包平台,其投入都不会是小数目。并且,大模型不是预训练出来就好,更需要后续持续敏捷迭代。从这一点看,创业公司所受的限制明显要高于大公司。

但大厂很难留住强算法人才的弊端也比较突出,因为大模型投入是一件长期主义的事,必定会面临与既有业务之间的冲突。这一点,从大厂出走的大模型创业者的经历,就说明了一点。长期主义对创业公司同样重要,无论是创始人的背景背书,还是资源合作,抑或是客户的拓展,都需要长期积淀。

三、行业竞赛即将鸣枪

人工智能专家侯世达的学生梅拉妮·米歇尔《AI 3.0时代》一书中提到,研究人工智能与赛道中的创业者们都熟悉了一种模式——先是“人工智能的春天”,紧接着是过度的承诺和媒体炒作,接下来便是“人工智能的寒冬”。并且,他认为这一模式将以五到十年为周期不断上演。

具体到2023年上半年的大模型赛道,显然其正处于第二个阶段——行业很火,市场很热。这一周期往往是最短的,也通常意味着如此去泡沫化后,赛道竞争即将正式开始。

大模型比拼的不仅仅是技术,还应该将重点放在大模型应用、产业生态中去评估。

目前,市场上大模型的玩家主要分三类。

一是聚焦基础层,主要对标OpenAI,发挥基础设施的作用。

第二类是锚定中间层,不需要像OpenAI一样花大钱做底层,只需要掌握通用化能力,就可以通过开源大模型做精调,让模型具备差异化能力,最终可以形成垂直类模型。

第三类是调用大模型API的企业,专注开发大模型具体场景的应用,如Jasper。

大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单

时间:2023-07-06 来源:

但可以看到,10亿级参数这个量级,很可能不是真正的“分界线”。因为现实的情况是,一些未能达到千亿规模的模型,很难在当前市场的竞争具有竞争力。不过,也不排除一些在垂直领域深耕的玩家,最终能跑出来。

“大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单。”夏先生认为,目前来看诸如百度、腾讯、阿里无论是在资源还是积累上,都有一定的优势,“他们在云市场深耕,并在自己擅长的领域积累多年,无论技术层面还是行业积累上,实质已经完成了抢跑,未来就看这些头部玩家如何落地。”

而在投入层面,这会是一个天文数字。

以百度为例。据透露,过去10年,百度在AI方向的投入已超过1000亿元。但大模型不是投一笔钱、做一个模型那么简单,它需要有算力、有数据、有经验丰富的AI工程师在好的研发平台上长期积累。

而创业公司如果直接去做基础大模型,除了上述投入之外,还需要能够把模型、算力管理好的AI开发平台。

这意味着,创业公司不论是自建开发平台,还是采购外包平台,其投入都不会是小数目。并且,大模型不是预训练出来就好,更需要后续持续敏捷迭代。从这一点看,创业公司所受的限制明显要高于大公司。

但大厂很难留住强算法人才的弊端也比较突出,因为大模型投入是一件长期主义的事,必定会面临与既有业务之间的冲突。这一点,从大厂出走的大模型创业者的经历,就说明了一点。长期主义对创业公司同样重要,无论是创始人的背景背书,还是资源合作,抑或是客户的拓展,都需要长期积淀。

三、行业竞赛即将鸣枪

人工智能专家侯世达的学生梅拉妮·米歇尔《AI 3.0时代》一书中提到,研究人工智能与赛道中的创业者们都熟悉了一种模式——先是“人工智能的春天”,紧接着是过度的承诺和媒体炒作,接下来便是“人工智能的寒冬”。并且,他认为这一模式将以五到十年为周期不断上演。

具体到2023年上半年的大模型赛道,显然其正处于第二个阶段——行业很火,市场很热。这一周期往往是最短的,也通常意味着如此去泡沫化后,赛道竞争即将正式开始。

大模型比拼的不仅仅是技术,还应该将重点放在大模型应用、产业生态中去评估。

目前,市场上大模型的玩家主要分三类。

一是聚焦基础层,主要对标OpenAI,发挥基础设施的作用。

第二类是锚定中间层,不需要像OpenAI一样花大钱做底层,只需要掌握通用化能力,就可以通过开源大模型做精调,让模型具备差异化能力,最终可以形成垂直类模型。

第三类是调用大模型API的企业,专注开发大模型具体场景的应用,如Jasper。

大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单

立即咨询