DeepSeek
栏目:公司资讯 发布时间:2025-09-01 10:34
May -set:Liu Xiaojie编辑:8月21日彭·海宾(Peng Haibin)预期的R2车型没有到达,但DeepSeek正式发布了新的Model v3.1。从命名来看,这可能不是主要版本的更新,而是上一代DeepSeek-V3模型的复发的小版本。在X中,DeepSeek称为v3.1“我们迈向代理商时期的第一步”。该升级具有三个主要亮点,包括更强的代理能力,混合思维模式和更高的思维效率。官员说,通过优化培训后,使用该工具和代理商活动的新模型的性能得到了极大的改善。在对编程代理和搜索代理的审查中,与DeepSeek系列的先前模型相比,v3.1得到了显着改善。Deepseek-V3.1是混合音乐会的架构,并且模型支持思维模式和非思想模式。目前,用户可以在官方应用程序和网页中体验新模型,并使用t他“深入思考”按钮可以在思维模式和非思想模式之间实现自由过渡。 DeepSeek API也在同时升级。 DeepSeek-Chat对应于非思考模式,DeepSeek-Reasoner对应于思想模式,上下文扩展到128K。 “混合推理很棒。拥有一个可以在深思熟虑和快速反应之间移动的模型感觉就像是人工智能的未来。”网民告诉X:“深层推理和快速反应之间的移动是天才。”基于深度的安排可以防止在简单任务中过度耗时,同时根据需要进行全面的评估。与以前的版本相比,v3.1的思维效率也更高。官员们说,DeepSeek-v3.1-思想的速度更快,同时保持答案的质量与Deptseek-R1-0528相当。官方的测试结果表明,在训练心灵的压缩链之后,v3.1-think o的平均表现F每个任务与R1-0528相同,当时输出令牌数量减少了20%-50%。当各种诊断指标的得分通常相同时,与R1-0528和v3.1-思维消耗的比较图表,在非思考模式下v3.1的输出长度也得到了有效控制。与DeepSeek-V3-0324相比,当输出长度显着降低时,输出长度可以保持相同的MOD Perfortricelo。同时,Deptseek价格调整的价格增加了,并且对模型API接口的价格提高了。自9月6日上午以来,晚上的折扣。就投入价格而言,缓存命中率为0.5元/百万个令牌,而价格缓存则缺少4元/百万个令牌(以前V3为2元/百万个令牌);输出价格为12元/百万个令牌(以前V3为8元/百万个令牌)。该官员指出,v3.1的主要模型是根据V3重新扩展的,总计840b代币接受了训练。主模型和训练后模型均以拥抱面和魔术来源。值得注意的是,DeepSeek还宣布,它增加了对人类API格式模型的支持。该官员提到的是“每个人都使用Anthoripic API生态系统的需求”,用户可以将DEPSEK-V3.1功能连接到Claude Code Framework。 特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。 注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。
服务热线
400-123-4567