DeepSeek “通情达理”这样炼成
看问题“更高一层”
当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。
当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。
你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。
还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。
你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。
AI的自我进化
一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?
不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。
经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。
20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。
进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。
DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。
算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。
算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。
数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。
将“顿悟”精准展示
饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。
以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。
DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。
其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。
对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。
“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。
有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。
更好地传递“衣钵”
随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。
就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。
蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。
许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?
在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。
标签:
抢先读
- DeepSeek “通情达理”这样炼成
- 新华社旗下四大财经媒体看两会·新兴产业两会新观察|智能“进化”:机器人产业蓄势待发
- 新华全媒+|中国下一代“人造太阳”关键系统验收 达到国际先进水平
- 蹚出“中国式”人工智能发展之路
- 两会看“新”|具身智能,前景几何?
- 融合“粉色浪漫”与自然诗意 南京中山植物园早樱盛放春色美
- 为大脑与脊髓搭建“新路” 我国科学家研发新技术助瘫痪病人恢复行走
- 哪吒周边产品义乌销售火爆 海外客户慕名而来
- 为大脑与脊髓搭建“新路” 我国科学家研发新技术助瘫痪病人恢复行走
- 3月10日“农产品批发价格200指数”比上周五上升0.31个点
- 3月10日“农产品批发价格200指数”比上周五上升0.31个点
- 加拿大称将继续对美征收报复性关税
- 帕杰罗的保养要点有哪些?帕杰罗油箱盖开关位置在哪?
- 今年前2月广西预计进资1.2亿美元
- 净值估算的依据是什么?净值估算是负数什么意思?
- 宁夏民营企业累计获签逾1900份RCEP出口原产地证书
- 宁夏民营企业累计获签逾1900份RCEP出口原产地证书
- 泉州中心市区首个交通岛遮阳棚启用 将有效缓解市民候灯时受天气困扰问题
- 青年消费,“性价比”走向“心价比”
- 中国最大南极磷虾专业捕捞加工船启航
- “民政通”率先完成原生鸿蒙适配 打造政务应用国产化转型示范样本
- 渝昆高铁三观楼隧道贯通 云南段隧道贯通已达70%
- 中新健康周报|政府工作报告首提“制定创新药目录”
- “民政通”率先完成原生鸿蒙适配 打造政务应用国产化转型示范样本
- 人民日报
- 人民日报
- 渝昆高铁三观楼隧道贯通 云南段隧道贯通已达70%
- 张克勤院士:建议加快植物保护法立法进程
- 销量下降、股价下滑 特斯拉7000亿可能要跌没?
- 国家卫健委主任:正起草育儿补贴操作方案
- “LIV Golf 2025”职业高尔夫球巡回赛中国香港站揭幕
- 销量下降、股价下滑 特斯拉7000亿可能要跌没?
- 极氪全尺寸SUV命名极氪9X,将于4月上海车展正式亮相
- 极氪全尺寸SUV命名极氪9X,将于4月上海车展正式亮相
- 单增海代表:建议推进工程机械二手车规范流转
- 纪念孙中山逝世百年 马英九倡两岸合作振兴中华
- 3月10日央行开展965亿元7天期逆回购操作
- 1至2月全国铁路发送旅客7.26亿人次 同比增长4.7%
- 王江平建议:引导多主体开展高质量行业数据集建设
- 跟着电影游中国 去年横店影视城外国游客量暴增近1000%
- 剑指“万亿级”!陕西高端装备制造业强势“出圈”
- 6G有多厉害?这些场景告诉你!
- 上海母港邮轮“海洋光谱”号单航次出境外籍旅客数超2600人 刷新纪录
- 北京短道速滑世锦赛名单公布 孙龙、范可新领衔中国队参赛
- 湖南冷水滩十万余人齐赶社 擦亮农耕文化品牌
- 中国住建部:坚决稳住楼市
- 全国人大代表李东林:加快推动绿电制氢产业发展
- 全国人大代表耿福能:建议推动“AI+医疗”落地基层
- 基金的收益是怎么产生的?买基金可以随时退出吗?
- 北京大兴机场口岸今年出入境人次破百万
- 全国人大代表李东林:加快推动绿电制氢产业发展
- 全国人大代表李东林:加快推动绿电制氢产业发展
- 降碳减污扩绿,全面绿色转型如何提速?
- 首店首展频亮相 杭州成“首发经济”新秀场
- 降碳减污扩绿,全面绿色转型如何提速?
- 全国人大代表郭兴田:优化“焕新”政策 释放家装市场潜能
- 住房城乡建设部部长:建设、大力推广“好房子”
- 股票短期头部意味着什么?趋势股一般能走多久?
- 净值估算低的时候可以购进吗?累计净值高好还是低好?
- 你关心的身边事,四位部长回应了
- 王启荣代表:打造国家物流枢纽承载城市让“物畅其流”
- 全国人大代表郭兴田:优化“焕新”政策 释放家装市场潜能
- 为迎峰度夏能源保供夯基 瓦日铁路展开春季集中修施工
- 王启荣代表:打造国家物流枢纽承载城市让“物畅其流”
- 王启荣代表:打造国家物流枢纽承载城市让“物畅其流”
- 股票当日委托交易没有成功会如何?股票涨停可以买入吗?
- 民生主题记者会丨住建部:将支持有条件的县级市开展城市体检
- 涉及就业、住房、养老……四位部长重磅发声!
- 从“愿景”转为“施工图” 政府工作报告绘出了绿色经济新蓝图
- 民生主题记者会丨住建部:住宅层高标准将调整为不低于3米
- 涉及就业、住房、养老……四位部长重磅发声!
- 民生主题记者会丨民政部:让老年人享受更好的“家门口”养老服务
- 民生主题记者会丨住建部:2000年以前建成的老旧小区纳入城市更新改造范围
- 股票定价和期货定价的异同是什么?a股和个股有什么关系?
- 金融赋能徽派企业“抱团出海”
- 西班牙学者:美关税政策将引发通胀 造成全球经济不稳定
- 民生主题记者会丨住建部:2000年以前建成的老旧小区纳入城市更新改造范围
- 民生主题记者会丨民政部:通过“四个转变” 有序推进民政民生保障向普惠性发展
- 西班牙学者:美关税政策将引发通胀 造成全球经济不稳定
- 民间资本迎来更大发展空间
- 海南自贸港加速建设国际旅游消费中心
- 传统文化焕新 助力“哪吒”出海
- 2月中国CPI同比下降0.7% 春节错月等因素影响
- 2月中国CPI同比下降0.7% 春节错月等因素影响
- 重庆动物源性产品监管体系首次通过新加坡地区准入认证
- 2月中国CPI同比下降0.7% 春节错月等因素影响
- 2月中国CPI同比下降0.7% 春节错月等因素影响
- 月活过亿App超七成接入AI
- 全球首个人形机器人“半马”将在京举办
- “店播”开辟电商直播新增长路径
- 月活过亿App超七成接入AI
- 全球首个人形机器人“半马”将在京举办
- “店播”开辟电商直播新增长路径
- 当DeepSeek学会说“人话”
- 两会观察·数说中国经济丨“3.6万亿元”折射科技创新力度
- 两会速递丨徐晓兰委员:工业互联网已实现工业大类全覆盖
- 两会速递丨徐晓兰委员:工业互联网已实现工业大类全覆盖
- 两会现场速递|“自动化的最后一个环节就等国产机器人实现了”——辽宁代表审议现场“催单”
- 疗愈+悦己 合肥上新女性主题市集
- 上海:2024年单采血小板临床供应量首度突破10万人份