5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。
在此次更新中,模型代码能力的提升最为显著。知名代码测试平台LiveCodeBench显示,更新后的R1性能可以媲美OpenAI o3模型的高版本。
除代码能力外,R1新版本模型的文本理解与推理能力亦实现跨越式升级。其上下文长度拓展至128k,长文本提取的准确率也有显著提升。
《每日经济新闻》记者(以下简称“每经记者”)通过俄罗斯方块游戏开发、太阳系模拟与交互展示,以及设计英伟达最新财报网页这三项任务对R1新版本进行了实测,发现DeepSeek-R1-0528的编程能力确实强大,对物理世界的理解以及文本的提取都相当准确。
DeepSeek延续了其一贯的低调风格,此次升级率先在微信群进行官宣,并轻描淡写地将其定义为“小版本升级”。
然而,众多开发者实测后发现,此次的“小”升级,并不小。升级后的DeepSeek-R1,模型能力可以说实现了跨越式提升。
据测试者反馈,DeepSeek-R1-0528能够一次性生成超千行无Bug代码,且在HTML/CSS/JS动态交互实现(如天气卡片动画、数据可视化)中更加精准。
除代码能力外,新版本模型的文本理解与推理能力亦实现跨越式升级。其上下文长度拓展至128k,长文本提取的准确率也有显著提升。
目前,ChatBot Arena也已经“上架”了最新版本的DeepSeek-R1,但还没有任何的测试结果。
为了更全面地测试DeepSeek-R1-0528的编程能力,每经记者设计了三项不同难度和类型的编程任务,包括网页游戏制作、物理世界模拟、财报可视化,来检验其在实际场景中的表现。
作为一款经典的休闲游戏,俄罗斯方块游戏的开发涉及图形绘制、游戏逻辑处理、用户交互等多个方面,能够很好地考察模型对于综合编程知识的掌握和运用能力。
每经记者首先向DeepSeek-R1提出需求:“请帮我开发一个网页端俄罗斯方块小游戏,要求包含游戏分数、彩色方块及多个关卡。”
DeepSeek仅思考了7秒,就开始输出代码。然而,初步生成的游戏无法正常运作,虽有预设的分数与关卡显示,但游戏区域内并没有俄罗斯方块。
随后,记者调整提示词,仅提了最基础的要求,“请帮我写个俄罗斯方块游戏(网页端),直接可以上手玩。”
简洁的指令似乎对DeepSeek-R1-0528更加奏效。这次R1思考9秒,用时约3分30秒便生成了代码。
从游戏页面来看,色彩搭配鲜明且协调,不同颜色的方块在深色背景下十分醒目,游戏区域布局合理,操作说明也清晰明了。
在游戏逻辑方面,方块的下落、移动和旋转都很流畅,没有出现延迟或卡顿现象。
接下来,难度升级。对于大模型而言,对物理世界进行准确模拟长期以来都是一项极具挑战性的任务。
此次,记者特意选取“行星轨道运动的物理模拟”这一任务,在考察其编码能力的同时,也考察DeepSeek-R1-0528对物理世界的理解能力。
从界面呈现看,太阳居于中心,八大行星依照各自轨道有序排布,色彩搭配也符合人们对天体的认知。此外,行星的大小比例、相对位置都比较精准。
同时,页面“行星信息”板块还以简洁明了的文字介绍了太阳及各大行星的关键特征,如太阳的质量、直径,水星的公转周期、表面温度等,兼具科普性与趣味性。
最后,每经记者上传了英伟达2026财年第一财季财报的文档,要求R1根据财报中的内容,制作一个可交互的网页。
DeepSeek-R1生成的网页令人眼前一亮。在视觉呈现上,网页采用了标志性的“英伟达绿”,颜色搭配协调。
数据方面,基本做到了准确无误,很少出现“幻觉”情况。此外,模型还绘制了柱状图、饼图等图表,让复杂的数据变得一目了然。
尽管可能还存在一些细微的提升空间。比如,在涨跌幅的颜色上,我们通常用红色表示上涨,绿色表示下跌。但可能由于记者投喂的是美股公司财报(美股一般用绿色表示上涨,红色表示下跌),R1用了与之对应的颜色来展示涨跌幅。
DeepSeek最新发布的R1模型升级版在全球AI领域掀起热议,多位国际主流科技大佬及行业高管纷纷发声,盛赞其技术突破。
机器学习研究者kalomaze实测后赞叹道,“DeepSeek太出色了。”
知名AI评论人Haider直呼,这是开源的一大胜利。“DeepSeek王者归来了。新版本的DeepSeek-R1在编程方面简直令人难以置信,这是我测试过的最佳模型。”
AI撰稿人乔治·霍普金(George Hopkin)表示,DeepSeek的R1模型更新后,推理和输出能力大幅提升,标志着中国在全球AI竞赛中的影响力日益增强。
瑞士IT咨询公司CTOL Digital Solutions首席执行官Max Zhang指出,DeepSeek的最新版R1模型,正悄然成为谷歌Gemini 2.5 Pro的强劲竞争对手。“这一发展不仅仅是技术进步,更是全球AI竞赛中的一个关键节点。该模型凭借其双倍输出能力和增强的数学推理能力,展示了中国在AI领域的快速崛起。”
DeepSeek此次更新的亮眼表现,为DeepSeek的下一代模型R2注入更多想象空间。Max Zhang表示,在这一“小”进步之后,我们确实可以期待更大突破的到来。
05月23日,云南西双版纳:星光夜市高人气点亮“夜经济”,澳门皇冠皇版,K8凯发登录官网,大陆365bet网址,升博下载
05月23日,织就千年风华 “90后”缂丝艺人“挑经显纬”间传承丝织技艺,百老汇注册彩金,王者体育苹果版下载,必发免费试玩,威尼斯官方网站娱乐
05月23日,老战士致敬视频获数十万点赞 他直言大家是为英雄点赞,AG和记,m6米乐娱乐入口,必威亚洲官网入口,新濠天地在线日传鉴中国非遗 点亮文化之美ManBetX万博在哪里玩龙8国际娱登录首页澳门正规游戏平台app优德平台怎么样
05月23日麦当劳中国科研总部落户江苏南京澳门永乐体育det365登录网站新宝gg手机APP365bet体育官网中文版
05月23日2024乌鲁木齐半程马拉松即将举办游戏网址188betapp链接火狐APP下载官网马经传密……
05月23日,“网红涌向联合国开会”背后:为带货打造成功人士人设,贝博在哪里玩,九游会官方入口,天博手机网页,波克捕鱼达人千炮版官方下载
05月23日,中方:菲方引入中导系统是对地区安全极不负责任的选择,必威手机登录在线优德网址,b体育官网素描,1bet77
05月23日青海海西探索盐化工产业质量基础设施集成服务新机制德国韦博官网一点红最新传密app最新版IM体育官网下载
05月23日,“五一”假期中国国内旅游出游2.95亿人次,伟德victory,必博入口,杏耀平台在线注册,亚美体育哪个国家的
05月23日,2024中国舞蹈“荷花奖”巡演走进沈阳,lol比赛外围的网站,bobapp体育官方下载,捕鱼游戏在线玩,澳门永利注册登录
05月23日,满怀信心 接续奋斗——十四届全国人大二次会议闭幕会侧记,快3正规app,天博国际官网,美高梅平台下载苹果版,e乐彩官网手机版登录
05月23日奥运冠军:运动员在提高专业训练的同时 也要做好未来规划威尼斯棋牌官网ag入口博鱼娱乐官网体球网足球
05月23日台风“潭美”引发海南三亚内涝 消防紧急排涝除险爱博真人永利体育下载地址伟德投注云鼎线日“美普绘”首届少儿艺术作品展在沪闭幕澳门正规赌盘必赢网络平台官网九州备用网址凤凰02下载
欢乐颂5定档,RTX50系列已开工投产去年访港旅客约3400万人次 内地成最大访港旅客市场 手机上玩钱的打牌游戏大发手机官网银河体育外围百人牛牛走势规律
龙图走进生活,小孩头卡防盗窗工人开三轮爬梯救助前三季度规上轻工企业实现利润超万亿元天博体育appios下载地址下载威尼斯人网站易游游戏官网永利国际平台
偷偷藏不住八大名场面,测评KFC新品香葱皮蛋蛋挞“小东北虎”勇闯山西感受“晋味中国年”博鱼登录入口必赢亚洲登陆long88868天博体育网
皇马提前4轮夺西甲冠军,周震南在改了8项公安交管便民利企改革新措施7月1日起实施 一图了解→马经财经B(新图推荐)华体会网址登录美高梅手机版网站登陆多宝真人
韩国政府部门再对离岗医生喊话,秒杀外挂太强了,异世界的家伙们根本就不是对手。春节上榜!世界“非遗”总数第一,中国是怎么做到的?足球注册平台捕鱼达人千炮版官方下载888真人国际送彩金mg线娱乐app下载
我的年度爱穿,男子骗女友100余万后假死脱身当事男子被行拘!警方通报奔驰插队事件 被砸车一方回应银河正规官方fun88体育网址奔驰宝马赌场manbetex