美国数据仓库巨头发布开源模型 公开挑战ChatGPT
在AI大模型时代,微软不会是唯一一个占据主导的企业。更多竞争对手正在迎头赶上。
3月24日,总部位于美国旧金山的初创公司Databricks发布了一款AI聊天机器人的代码。Databricks称公司可以像OpenAI的ChatGPT一样,可以使用这些代码创建自己的聊天机器人,并将代码开源。
【资料图】
Databricks是一家数据仓库巨头公司,向企业销售基于云的数据挖掘和分析软件,去年收入超过10亿美元,最新估值已经达到380亿美元,超过OpenAI公司290亿美元的估值。
该公司最新发布的代码可以看作是一个AI大模型,具有巨大的资源和计算能力,是一种在数据集上训练的算法,可以从新数据中学习以执行各种任务。
Databricks公司首席执行官Ali Ghodsi表示,将该模型开源的意图很明确,就是为了展示一种可行的ChatGPT的替代方案。不过该公司还没有发布正式的基准测试,来比较这一模型与ChatGPT的性能。
目前OpenAI已经开始向通过API接口访问该公司大模型的企业收取费用,并预计到2024年的销售额将达到10亿美元。
Databricks希望企业可以使用该公司的软件来训练自己的人工智能模型。Ghodsi称,该公司的研究人员在过去两年中,已经使用这一免费模型,通过租用的计算机,训练了三小时的小规模数据。
“我们最终的目标是把这些模型做得越来越小,而且它们将是开源的。未来每个人都会有自己的模型,他们可以训练这个模型,并且可以让它变得更好。”Ghods说,“这样,也就不必将数据泄露给其他人。”
“大模型全靠数据,数据是基础。即便是同一个模型,仅增加数据量,产生的效果都会有质的差异。”一位人工智能领域资深人士对第一财经记者表示,“模型反映的是算法、效率,数据反映的是真实世界的问题,是本质。”
自微软和OpenAI的ChatGPT发布以来,企业的竞争开始从算法蔓延到数据。
最新消息称,微软公司已警告竞争对手,如果不停止基于ChatGPT的模型来“喂”自己的人工智能聊天产品,将切断对这些竞争对手互联网搜索数据的访问权限,因为这违反了API授权协议。不过微软官方并未对此种说法做出回应。
对此,一位接近微软的业内人士向第一财经记者分析称:“当算法发展到某一个阶段时,算法会过剩,数据可能跟不上。所以作为微软这样的大型巨头,会限制竞争对手利用其数据。”
对于微软凭借ChatGPT试图重新夺回消费技术市场领先地位的做法,OpenAI的共同发起人之一、特斯拉CEO马斯克近日再度在社交媒体上抨击微软“将OpenAI占为己有”。
马斯克3月24日在Twitter上写道:我最早向OpenAI捐赠了1亿美元,当时它还是非营利的机构,没有所有权,也不受任何人控制。
已经有欧洲竞争对手开始向监管机构游说,认为微软需要为解决反垄断的问题作出更大的努力。目前,欧盟监管机构正在评估是否对微软云业务构成行业垄断进行调查。