DeepSeek刷屏:国产大模型崛起,用户热议背后的秘密

DeepSeek刷屏:国产大模型崛起,用户热议背后的秘密

来源:劳动观察

作者:陈宁 2025-01-28 12:57

2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布开源。

新年伊始,一款国产大模型DeepSeek-V3在科技圈和社交媒体上引发了广泛关注,热度持续攀升。作为一款备受瞩目的AI助手,DeepSeek-V3凭借其卓越的性能和用户体验,迅速成为用户讨论的焦点。那么,究竟是什么原因让DeepSeek-V3在这两天如此火爆,用户的使用体验如何,它为何被称为“最强国产大模型”?


用户使用体验:高效、智能、易用


近期,DeepSeek-V3的开发者深度求索公司推出了多项更新,包括模型性能的优化、知识库的扩展以及用户体验的升级。这些更新让DeepSeek-V3在短时间内吸引了大量用户,尤其是媒体、教育、科研等领域的从业者,纷纷尝试并分享使用体验,进一步推高了其热度。甚至因为用户访问激增,出现了短时闪崩、对话无响应等现象。


许多用户在体验DeepSeek-V3后表示,这款AI助手在响应速度、回答准确性和交互流畅度上都有显著提升,尤其是“深度思考”的功能迭代令人吃惊。一位媒体从业者表示:“DeepSeek-V3在处理复杂问题时表现得非常出色,尤其是在中文语境下,它的理解能力远超其他同类产品。”


一位金融分析师在社交媒体分享案例:当输入一份夹杂专业数据和口语化描述的行业报告后,DeepSeek-V3不仅精准提炼出关键趋势,还能结合历史政策背景生成简明解读。“它像是一个真正懂行的研究员,而不是只会拼贴数据的机器。”


此外,用户还特别提到了DeepSeek-V3的文件处理功能,称其能够快速提取文件中的关键信息,极大地提高了工作效率。


热度飙升的背后:大模型训练成本大降


DeepSeek-V3的热度飙升,除了在用户端获得了使用者的“五星好评”,在开发者端,同样收获了“物美价廉”的称号。


据了解,1月20日,深度求索正式发布推理大模型DeepSeek-R1。有开发者评论,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。


值得注意的是,DeepSeek公众号显示,DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出 tokens 16元。据悉,输出API价格只有OpenAI o1的3%


前OpenAI联创、知名AI科学家AndrejKarpathy在其个人社交平台上表示,DeepSeek-V3整个训练过程仅用了不到280万GPU小时,相比之下,Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。若从成本上进行更直观的对比,DeepSeek-V3的总训练成本仅为600万美元不到,是Llama-3405B超6000万美元训练成本的十分之一不到。


他表示,如果DeepSeekV3的优良表现能够得到广泛验证,那么这将是资源有限情况下对研究和工程的一次出色展示。


争议与期待并存:“最强”标签是否名副其实?


DeepSeek爆火后,目前,该App已经登顶苹果中国和美国应用商店免费APP下载排行榜,超越了ChatGPT。不仅如此,在国内各大社交媒体上,这款App还被冠上了“最强国产大模型”的称号。


从目前多家科技自媒体发起的评测来看,这一称号并非空穴来风。横向对比来看,DeepSeek-V3在多项中文测评中已超越同类国产产品,而相较于ChatGPT,它的优势则体现在对中文复杂语义的细腻处理上。


更深层的竞争力则来自技术迭代的速度。据报道,深度求索团队采用“动态优化”策略,通过用户真实反馈数据实时微调模型,这使得DeepSeek-V3的升级周期缩短至周级别。


一位教育科技公司CTO透露,他们已将DeepSeek-V3接入在线答疑系统,原本需要手动标注的模糊问题(如学生用“鸡兔同笼但脚数不对”描述数学题),现在模型能自动识别并关联知识点,这种快速落地的实用性成为企业选择它的关键理由。


当然,热度背后也有质疑声。部分用户指出,在处理高度专业的医学、法律咨询时,DeepSeek-V3仍会给出“看似合理但需谨慎验证”的答案;与GPT-4等顶尖模型相比,其多语言能力尚有差距。对此,深度求索团队回应称“不会追求大而全的参数竞赛”,而是聚焦中文场景的深度优化,未来计划开放行业定制接口,让模型在医疗、金融等垂直领域更具专业性。


无论如何,DeepSeek-V3的爆发已让市场看到国产大模型的另一种可能——不再是对国际模型的简单追随,而是以本土化需求为核心,在技术路径与用户体验上走出自己的节奏。随着更多开发者通过其开放平台接入创新应用,这场由热度引发的行业变革,或许才刚刚开始。


头图为DeepSeek页面截图




责任编辑:李蓓

劳动观察新闻,未经授权不得转载