发布日期:2026-03-31 17:41 点击次数:154
上证报中国证券网讯(记者谭镕)1月28日,国内火爆的AI大模子公司DeepSeek称碰到大限制坏心膺惩。另引东谈主暖热的是,东谈主工智能社区Hugging Face显现,DeepSeek新发布了开源多模态东谈主工智能模子Janus-Pro。
DeepSeek遭大限制坏心膺惩
DeepSeek官网工作情状页面显现,“近期DeepSeek线上工作受到大限制坏心膺惩,注册可能忙绿,请稍等重试。已注册用户不错日常登录,感谢瓦解和支捏。”
新发布的开源多模态东谈主工智能模子Janus-Pro是一款长入多模态瓦解与生成的翻新框架,通过解耦视觉编码的面目。Janus-Pro构建于DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基础之上。
据DeepSeek先容,Janus-Pro是一种新颖的自转头框架,长入了多模态的瓦解与生成。它通过将视觉编码划分为沉寂的旅途,搞定了以往程序的局限性,同期仍然接收单一的长入Transformer架构进行处理。视觉编码的划分不仅缓解了视觉编码器在瓦解与生成任务中的变装破损,还进步了框架的活泼性。Janus-Pro不仅超过了之前的长入模子,还能匹配或超过任务专用模子的性能。
其中Janus-Pro-7B在GenEval和DPG-Bench基准测试中打败了OpenAI的DALL-E 3和Stable Diffusion。
开源、绽开
1月20日,DeepSeek推出了东谈主工智能模子R1,这是一款为搞定复杂问题而贪图的专用模子。在国出门圈之后,DeepSeek的工作需求激增。
DeepSeek称,DeepSeek-R1在后实际阶段大限制使用了强化学习本事,在仅有少许标注数据的情况下,极大进步了模子推理才调。在数学、代码等任务上,性能并列OpenAI o1郑再版。
DeepSeek还绽开了许可证和用户契约,据先容,开源仓库(包括模子权重)长入接收尺度化、宽松的MIT License,王人备开源,不限制商用,无需苦求。而且,DeepSeek支捏用户进行“模子蒸馏”。
DeepSeek首创东谈主梁文锋曾先容,在颠覆性的本事眼前,闭源造成的护城河是一刹的。即使OpenAI闭源,也无法拆开它被别东谈主赶超。“开源、发论文,其实并莫得失去什么。对于本事东谈主员来说,被Follow是很有配置感的事。开源更像一个文化步履,而非买卖步履……”
DeepSeek大模子降价
在大模子“用度”方面,在DeepSeek绽开平台官网信息显现,deepseek-chat模子优惠期至北京时期2025年2月8日24:00,时代API调用享历史价钱,优惠实现后将按每百万输入tokens2元,每百万输出tokens8元计费。deepseek-reasoner模子上线即按每百万输入tokens4元,每百万输出tokens16元计费。
此前,DeepSeek称,DeepSeek-R1 API工作订价为每百万输入tokens1元(缓存掷中)/4元(缓存未掷中),每百万输出tokens16元。“输出API的价钱仅为OpenAI o1的3%。”绽开社区本事东谈主员驳倒。
早在2024年5月,DeepSeek发布全新第二代MoE大模子DeepSeek-V2,并发布订价。DeepSeek-V2 API的订价为每百万token输入1元、输出2元(32K坎坷文)。而后,智谱AI、字节进步、阿里、百度、腾讯等大厂接踵文牍调价。
对于大模子价钱战,梁文锋在选择媒体采访时暗示,“降价一方面是因为咱们在探索下一代模子的结构中,老本先降下来了,另一方面也认为不管API、依然AI,都应该是普惠的、东谈主东谈主不错用得起的东西。”
这背后与老本撑捏密不行分。2024年12月,DeepSeek-V3就激发业内高度暖热。据先容,DeepSeek-V3为自研MoE模子,671B参数,激活37B。这款在性能上和寰宇顶尖的闭源模子GPT-4o以及Claude-3.5-Sonnet不分昆仲的模子,消费却只“近600万好意思元”。
天神投资东谈主Balaji称现金澳门新银河app平台,DeepSeek开源模子仅消费了约560万好意思元进行实际,性能与GPT 4和Claude 3.5 Sonnet异常。若是属实,老本将镌汰10倍以上。


