谷歌泄密文件:AI大战,谷歌没有护城河,OpenAI也没有
AI大战,究竟谁才是最终赢家?
或许既不是人们讨论最激烈的OpenAI,也不是微软、谷歌等科技巨头,开源AI可能将在未来占领高地。
周四,据媒体semianalysis报道,谷歌研究员在一份泄密文件中坦言,谷歌没有护城河,OpenAI也是如此,与开源AI竞争将难以占据优势。
(资料图片仅供参考)
正如文件中提到的,开源模型训练速度更快,可定制性更强,更私密,而且比同类产品能力更出色。他们正在用100美元和130亿的参数做一些“谷歌1000万美元和540亿的参数难以企及”的事情,而且在短短几周内就能做到,而不是几个月。
对于用户而言,如果有一个没有使用限制、免费、高质量的替代品,谁还会为谷歌的产品付费呢?
以下是谷歌泄密文件:
谷歌没有护城河,OpenAI也是如此
我们对OpenAI进行了很多审视和思考,谁会跨越下一个里程碑?下一步会有什么行动?
但令人不安的事实是,我们没有能力赢得这场军备竞赛,OpenAI也是如此。在我们争吵不休的时候,第三个派别一直在悄悄地抢我们的饭碗。
我指的是开源AI,简而言之他们正在抢走我们的市场份额。我们认为的“主要的开放问题”如今被解决了,并且已经触达用户。仅举几例:
手机上的LLMs:人们以5 tokens/sec在Pixel 6上运行基础模型。
可扩展的个人人工智能:你可以在一个晚上用你的笔记本电脑上微调生成个性化的AI助手。
负责任的发布:这个问题并没有“解决”,而是“避免”。有的整个网站充满了没有任何限制的艺术模型,而文字也不甘落后。
多模态性:目前的多模态ScienceQA SOTA是在一小时内训练完成的。
虽然我们的模型在质量上仍有一点优势,但差距正在以令人惊讶的速度迅速缩小。开源模型训练速度更快,可定制性更强,更私密,而且比同类产品能力更出色。他们正在用100美元和130亿的参数做一些“谷歌用1000万美元和540亿的参数难以企及”的事情,而且在几周内就能做到,而不是几个月。这对我们有深远的影响:
我们没有诀窍。我们最大的希望是向谷歌以外的其他人学习并与他们合作。我们应该优先考虑实现3P整合。
当免费的、不受限制的替代品质量相当时,人们不会为一个受限制的模式付费。我们应该考虑我们的附加值到底在哪里?
大模型正在拖累我们,从长远来看,最好的模型是那些可以快速迭代的模型。
发生了什么?
三月初,Meta的大语言模型LLaMA被泄露,开源社区得到了第一个真正有能力的基础模型。它没有指令或对话调整,也没有RLHF。尽管如此,社区立即理解了他们所得到的东西的意义。
随后,巨大的创新成果接连涌现出来,发展仅仅间隔了几天。现在,不到一个月的时间,就出现了指令调整、量化、质量改进、人类评价、多模态、RLHF等变体,许多都是相互关联的。
最重要的是,他们已经解决了缩放(scaling)问题,达到了任何人都可以调整的程度。许多新的想法都来自于普通人,门槛已经从一个主要研究机构下降到一个人、一个晚上和一台强大的笔记本电脑。
在许多方面,这对任何人来说都不那么惊讶。当前开源大模型的复兴紧随生成图像模型的火热,开源社区并没有忘记这些相似之处,许多人称这是LLMs的“Stable Diffusion”时刻。
通过低秩矩阵微调方法(LoRA),结合规模上的重大突破(如大模型Chinchilla),公众可以用较低成本参与进来;在这两种情况下,获得一个足够高质量的模型可以引发了世界各地的个人和机构的想法和迭代的热潮,很快就会超越大型企业。
这些贡献在图像生成领域非常关键,使Stable Diffusion公司走上了与Dall-E不同的道路。拥有一个开放的模式带来的产品整合、市场、用户界面和创新,这些都是Dall-E所没有的。
其效果是可想而知的:在文化影响方面,与OpenAI的解决方案相比,它迅速占据了主导地位,变得越来越相互依赖。同样的事情是否会发生在LLM上还有待观察,但广泛的结构元素是相同的。
我们错过了什么?
开源最近成功的创新直接解决了我们仍在挣扎的问题,多关注他们的工作可以帮助我们避免重蹈覆辙。
LoRA是一个非常强大的技术,我们应该多加注意,LoRA的工作原理是将模型更新表示为低秩因子化,这将更新矩阵的大小减少了几千倍。这使得模型的微调只需要一小部分的成本和时间。能够在几个小时内在消费类硬件上对语言模型进行个性化调整是一件大事,特别是对于那些涉及在近乎实时的情况下纳入新的和多样化的知识。这项技术的存在在谷歌内部没有得到充分的利用,尽管它直接影响了我们一些最雄心勃勃的项目。
从头开始重新训练模型是一条艰难的道路,LoRA之所以如此有效,部分原因在于--像其他形式的微调--是可堆叠的,像指令调整这样的改进可以被应用,然后随着其他贡献者增加对话、推理或工具使用而被利用。虽然单个的微调是低等级的,但它们的总和不需要,允许模型的全等级更新随着时间的推移而积累。
这意味着,随着新的和更好的数据集和任务的出现,模型可以以较低成本保持更新,而不需要支付全面训练的费用。
相比之下,从头开始训练大模型,不仅丢掉了预训练,还丢掉了之前的任何迭代改进。在开源的世界里,这些改进在不久之后就会占据主导地位,从而使全面重新训练的成本变得非常昂贵。
我们应该深思熟虑,每个新的应用或想法是否真的需要一个全新的模型。如果我们真的有重大的架构改进,那么我们应该投资于更积极的提炼形式,尽可能地保留前一代的能力。如果我们能在小模型上更快地进行迭代,那么从长远来看,大模型并不是更有优势。
LoRA更新的成本非常低(约100美元),这意味着几乎任何有想法的人都可以生成。训练时间少于一天是很正常的,在这种速度下,所有这些微调的累积效应不需要很长时间就可以克服初始的模型规模劣势。
数据质量的扩展性比大小更好体现在这些项目中,许多模型通过在小型、高质量的数据集上进行训练来节省时间。这表明在数据扩展规律有一定的灵活性,同时正迅速成为谷歌之外的标准训练方式。这两种方法在谷歌都不占优势,但幸运的是,这些高质量的数据集是开源的,可以免费使用。
与开源直接竞争是一个赔本生意
最近的这一进展对我们的商业战略有直接、重大的影响,如果有一个没有使用限制、免费、高质量的替代品,谁还会为谷歌的产品付费呢?
而且,我们不应该指望能够追赶上,现代互联网在开放源码上运行是有原因的,开放源码有一些无法复制的优势。
我们更需要他们,对我们的技术进行保密始终是不稳固的,谷歌的研究人员经常变动,所以我们可以假设他们知道我们所知道的一切,而且只要这个途径是开放的,相关技术就会继续散播出去。
但在技术方面保持竞争优势变得更加困难,世界各地的研究机构都在彼此的工作基础上,以广度优先的方式探索解决方案的空间,远远超过了我们的能力。我们可以尝试紧紧抓住我们的秘密,而外部的创新会稀释它们的价值,或者我们可以尝试相互学习。
标签:
抢先读
- 认识中草药,这些原创绘本很适合给孩子看
- 动态焦点:安全标识补齐了,学生过马路安心了
- 实施不动产登记“一件事一次办”首月河北办理业务突破2700件
- 一季度山西对RCEP成员国进出口同比增长12.5%
- 中国生物水痘减毒活疫苗获斯里兰卡注册证书
- 国家邮政局:今年全国快递业务量突破400亿件_全球观焦点
- 天天微资讯!离开国乒联手张本智和!31岁国乒大将退出,网友:在日本会如何
- 龙岩:建设新园区 兴起产业群 全球微资讯
- 本科征集志愿什么意思_本科征集志愿的解释
- 铁路五一小长假共发送旅客1.33亿人次 较2019年同期增加2794万人次
- 弘业期货:铁矿石短期内维持偏弱震荡
- 【资讯】艺术课拟贯穿九年义务教育|每日讯息
- 泉州芯谷南安科创中心项目一期主体结构封顶
- “五一”楼市整体平淡,淄博却成最大赢家?_天天快看点
- 上市银行一季度扩表提速 资产质量向好
- 西安现代控制技术研究所职工赵昕晨荣获“陕西省技术能手”荣誉称号
- 贾跃亭FF 91量产加速?FF任命新生产总裁:有35年造车经验|天天新要闻
- 内蒙古:审议通过新一批拟入额检察官人选 2020年来向基层院动态调配员额99名 环球观天下
- 费孝通与友人信:令现代中国人彷徨的课题|热文
- 图灵看市5.5-白银继续测试前高、或一举突破 环球微资讯
- 2023石家庄高三三模_质检三答案及试卷汇总_更新中-热门
- 环球热门:新华指数|山东港口原油现货价格大幅下跌(5月5日)
- 甘南五岁孩子抚养费怎么算
- 沪强深弱 5月首个交易日A股成交再超万亿!哪些板块将成主线?-天天资讯
- 业务量增速逐月向好,已超300亿件 快递业整体企稳回升
- MONCLER 集团一季度收入增长23%
- 环球头条:三项计划“组合出击” 精心规划深入提升青岛科创能力
- 空调一级能效与三级能效制冷哪个好 今日讯
- 文旅部:拟确定宿迁骆马湖等3家旅游度假区为国家级旅游度假区_环球看热讯
- 最新消息:张学友探班周杰伦演唱会 晒合照亲切搭肩膀
- 2023江淮十校高三5月联考数学试卷及答案汇总_文数/理数
- 万年青:5月4日融资买入149.5万元,融资融券余额2.64亿元 环球快资讯
- 第六届中国(山西)国际房车露营博览会开幕|当前热点
- 关于爱国的人物故事50字_关于爱国的人物故事-世界报资讯
- 青海移动网络安全攻防实验室挂牌成立
- 当前信息:节后生产忙
- 谷歌泄密文件:AI大战,谷歌没有护城河,OpenAI也没有
- 热头条丨山东菏泽周边旅游景点攻略_山东菏泽周边景点
- 芝加哥电影网盘_芝加哥电影迅雷下载|全球快看
- 2023阳泉三模答案及试题各科目汇总!_持续更新
- 美国纽约股市三大股指4日集体下跌 全球热点
- 创新“深”态第19期丨厚植发展新势能 三博脑科借力资本市场打造国际一流医疗健康科技集团_观察
- 泰晶科技(603738.SH):去年增加XO振荡器部分产能,主要用于工业级场景如服务器领域_每日速递
- 一季度我国互联网业务利润总额大幅增长_即时
- 青海移动网络安全攻防实验室挂牌成立-观热点
- 文化和旅游部推出10条长江主题国家级旅游线路和《长江国际黄金旅游带精品线路路书》|全球简讯
- 当前速讯:青海767万头(只)牦牛藏羊原产地可追溯
- 雪松控股沉浮 为啥没成“中国版嘉能可”?
- 228款手机维修调查:谷歌Pixel 7最难修、Moto G7最易修|世界时快讯
- 多公司收关注函,上市公司现金分红背后不应藏猫腻|天天快资讯
- 全球快报:今世缘2018最近一期电视剧_今世缘2018最近一期
- 世界今日讯!男子患肺炎想快点退烧吞下40片退烧药 旧病未除添新病
- 新动态:造车不是过家家
- 电力股为何集体上涨?多家电力公司一季报露曙光|环球热文
- 智联招聘报告:2022年智能制造产业用人需求同比增长53.8% 热头条
- 蒸蛋糕要多长时间,用大火还是小火?_全球头条
- 陕西旅游(870432):陕西旅游集团有限公司2023年面向专业投资者公开发行公司债券(第一期)上市_全球今头条
- “五一”假期陵水旅游热度“狂飙”
- 特斯拉中国四天内两次涨价:新款Model S和X调涨1.9万元
- 焦点关注:点赞!“知心姐姐”的带兵之道
- 可炫可酷 可甜可盐 400件艺术品让观众直呼大开眼界_天天报资讯
- mp3下载电子书后看不到内容_mp3下载电子书
- 捕获全景图后,黑洞“电影”还会远吗-世界观焦点
- 当前报道:长江证券:5月4日融券卖出73.87万股,融资融券余额10.6亿元
- 中国区营收下滑 库克表示印度拯救苹果
- 外贸需求旺 纺企生产忙-世界即时看
- 【环球播资讯】法恩莎携科技新品优雅亮相,推动未来生活向好
- 美联储加息或达尾声,或进一步有利于外资流入 环球快播
- 演员姜文逝世追悼会_天天速讯
- 小学生足球手抄报图片_小学生足球手抄报
- 李鸿彬:5.5非农还会助涨黄金新高吗?走势分析及布局 微速讯
- 美国一玩具公司推出华裔演员黄柳霜芭比娃娃
- 全球热议:七拼八凑游戏物品清单_七拼八凑
- 焦点快看:如何整理磁盘碎片_下面是整理磁盘碎片的步骤
- 跳豆腐小游戏_跳豆 每日报道
- 文博日历丨巴适得很!石刻连环画里的宋朝巴蜀人
- 逆变器概念领跌 飞荣达大跌|全球新资讯
- 黄景怡_黄瀞怡
- 调整心态控制情绪的方法_如何调整心态又如何控制情绪
- 5月4日LME基本金属库存统计
- 焦点简讯:连续三年专业第一,来看同济学子的“追梦”故事……
- 世界最新:电话线型号规格6p4c-电话线型号
- 三湘印象:5月4日融资买入445.43万元,融资融券余额1.2亿元
- 大班第一学期工作总结简短_大班第一学期工作总结
- 小米13 Ultra定制色明天首销:限量抢 6499元 新消息
- 世界视讯!北京大学迎来125周年校庆 校友“燕归园”重温旧时光
- 研究人员探索人们如何通过视觉艺术中的颜色和线条来描绘和感知情感_当前热讯
- 新商盟手机客户端下载_新商盟手机网上订烟
- 避险需求推动黄金两日连涨 创三周新高|世界通讯
- *ST日海(002313):5月5日10时06分触及涨停板 世界简讯
- “五一”假期 福建道路客运量达417.1万人次
- 古诗中屠苏指的是什么_古诗中屠苏的意思
- 一汽解放:5月4日融资买入584.27万元,融资融券余额5.86亿元
- 孕妇可以吃油菜吗?_每日消息
- lebron 17low_LEBRON 11
- 古风眈美先虐后文_古风眈美_当前速讯
- 微头条丨快递业整体企稳回升 业务量增速逐月向好
- 快资讯丨伙计的大概意思是什么_伙计是什么意思简介介绍
- 全球最资讯丨外卖小哥打12345建议,北京这小区有了“应急送药车”!
- 黄冈市遴选11家“金色阵地”,面向青少年群体重点推介