#DeepSeek

共 687 篇相关文章

科技前沿

2026年5月30日·6 分钟

SGLang v0.5.12.post1发布：DeepSeek V4稳定性修复与Blackwell适配

SGLang v0.5.12.post1稳定性补丁详解，包含12项关键修复，涵盖DeepSeek V4乱码与崩溃问题、NIXL PD分离式推理逻辑修复、Blackwell B300架构适配及冷启动性能优化。

阅读全文 →

科技前沿

2026年5月30日·7 分钟

Step 3.7 Flash：198B稀疏MoE多模态模型深度解析

深度解析StepFun AI发布的Step 3.7 Flash，一款198B参数稀疏MoE视觉语言模型，支持256K上下文与三级推理，在多模态理解、AI编程和Agent工具编排方面表现顶尖，已获SGLang首日支持。

阅读全文 →

Cloudflare向SGLang贡献KV Cache与Mooncake关键修复

科技前沿

2026年5月30日·5 分钟

Cloudflare向SGLang贡献KV Cache与Mooncake关键修复

Cloudflare向SGLang上游提交decode KV cache offload和Mooncake recovery两项关键修复，解决高并发场景下Kimi K2.6模型乱码输出问题，并实现分布式推理节点自动故障恢复，提升生产环境稳定性。

阅读全文 →

AMD MI355X击败B200：DeepSeek-R1推理TCO低5%的全栈优化解析

行业洞察

2026年5月30日·7 分钟

AMD MI355X击败B200：DeepSeek-R1推理TCO低5%的全栈优化解析

AMD Instinct MI355X通过SGLang+MoRI全栈优化，在DeepSeek-R1分离式推理中实现TCO比NVIDIA B200低5%，每GPU吞吐量高1.25倍。深度解析MoRI量化通信、KV Cache优化及推测解码等核心技术突破。

阅读全文 →

科技前沿

2026年5月30日·6 分钟

LFM2.5-8B-A1B：1.5B激活参数实现4倍体量效果的MoE模型

Liquid AI发布LFM2.5-8B-A1B模型，采用MoE架构，8B总参数仅激活1.5B，在工具调用场景中媲美6B级模型表现。支持128K上下文、本地部署、多语言，SGLang即时支持。

阅读全文 →

产品体验

2026年5月30日·10 分钟

Llama 3.3 70B深度测评：13道题实测最强开源大模型

Meta发布Llama 3.3 70B开源模型，仅70B参数却媲美405B性能。经过13道逻辑推理、数学计算、编程题全面测试，通过12题表现惊艳，重塑开源模型格局。

阅读全文 →

产品体验

2026年5月30日·8 分钟

13大AI模型编程能力实测：谁才是最强编程助手？

横向评测GPT-4.1、Claude 3.7 Sonnet、Gemini 2.5 Pro等13大AI模型的编程能力，通过同一道高难度算法题从代码正确性、解题思路、多语言转换等8个维度打分，揭晓最强AI编程助手排名。

阅读全文 →

产品体验

2026年5月30日·6 分钟

一人公司AI工具红黑榜：七大模块首选平替开源全解析

从文字、图像、视频、音频、数字人、编程、Agent七大模块出发，按首选、平替、开源三个层级梳理一人公司最值得用的AI工具矩阵，涵盖Gemini、Cursor、Dify等主流工具实测评价。

阅读全文 →

教程攻略

2026年5月30日·3 分钟

零基础搭建AI智能体：扣子平台实战指南

详解如何用扣子（Coze）平台零基础搭建AI智能体，无需编程即可将DeepSeek接入微信、自动发邮件、做海报PPT。涵盖10个实战项目，适合内容创作者、HR、销售、运营等职场人群快速上手。

阅读全文 →

产品体验

2026年5月29日·7 分钟

Claude Opus 4.8 实测：一小时能做出什么？

实测Claude Opus 4.8的编程与创作能力，包括马里奥小游戏、杀戮尖塔风格卡牌游戏开发全过程，分析Codex与Claude Code协作模式的优劣，以及额度消耗、Bug频率等真实体验反馈。

阅读全文 →

Claude Code桌面版安装配置教程：免账号使用+接入DeepSeek+中文汉化

教程攻略

2026年5月29日·9 分钟

Claude Code桌面版安装配置教程：免账号使用+接入DeepSeek+中文汉化

详细图文教程教你安装Claude Code桌面版，通过开发者模式免账号使用，借助CSwitch接入DeepSeek等国产模型，完成中文汉化及自定义Skill配置，打造低成本AI编程工作流。

阅读全文 →

教程攻略

2026年5月29日·7 分钟

Claude Code入门指南：对比普通AI编程的5大核心优势

深度解析Claude Code与普通AI对话工具的核心区别，从交互方式、上下文理解、执行力、记忆能力、工具调用五大维度对比，帮助开发者了解这款AI编程助手的真正实力。

阅读全文 →

教程攻略

2026年5月29日·7 分钟

多模型热切换架构：低成本实现AI模型自由切换

详解工业级AI项目多模型热切换架构的完整实现方案，涵盖模型抽象层设计、前端可视化配置、适配器模式及报错修复闭环，帮你把换模型从一周工程量压缩成一分钟操作。

阅读全文 →

行业洞察

2026年5月29日·9 分钟

大模型三大岗位深度解析：门槛、技术栈与职业前景

深度解析大模型应用工程师、研发工程师、算法工程师三大核心岗位的技术要求、薪资门槛与发展前景，涵盖RAG、模型微调、推理部署等关键技术栈，助你制定清晰的AI职业规划路径。

阅读全文 →

教程攻略

2026年5月29日·6 分钟

MCP协议实战指南：大模型连接万物的标准接口

深入解析MCP（Model Context Protocol）协议的工作原理与实战应用。了解大模型如何通过MCP连接外部工具成为智能体，涵盖Java开发者技术栈、MCP Server生态、Cherry Studio实操及A2A协议对比。

阅读全文 →

教程攻略

2026年5月29日·7 分钟

LangGraph 0.5.3+MCP智能体开发实战：安全认证与部署方案详解

详解LangGraph 0.5.3版本两大新特性：MCP服务端安全认证机制和智能体服务器部署方案。结合千问三大模型，提供智能体核心架构解析、MCP整合要点及入门学习路径，助力开发者构建生产级AI智能体。

阅读全文 →

前沿研究

2026年5月29日·7 分钟

AI玩游戏实力大比拼：O3 Pro展现惊人规划能力

研究者用俄罗斯方块、超级马里奥、推箱子等经典游戏测试各大AI模型，O3 Pro展现出前所未有的规划能力，成为唯一通关全部关卡的模型。游戏测试揭示AI正从模式匹配向真正的战略思维演进。

阅读全文 →

教程攻略

2026年5月29日·8 分钟

DeepSeek V4 Flash MTP推测解码实测：本地推理提速20%指南

实测DeepSeek V4 Flash开启MTP推测解码后的性能表现：代码生成场景提速约20%，文本生成提升有限。详解内存开销、准确性差异、Q4与Q3量化对比，以及通过Inference应用和OpenAI兼容API的完整部署教程。

阅读全文 →

教程攻略

2026年5月29日·9 分钟

Bolt DIY + Claude 3.7：零成本搭建AI编程环境全攻略

详解如何用开源免费的Bolt DIY搭建本地AI编程环境，接入Claude 3.7 Sonnet API，实现11美分构建完整应用。含安装配置、免费模型替代方案、实战案例及部署上线全流程。

阅读全文 →

行业洞察

2026年5月29日·6 分钟

不会写代码用AI接单做网站，3条视频变现近万元的实操复盘

十年产品经理不会编程，用Cursor等AI编程工具接单做网站，仅发3条短视频就变现近万元。本文拆解他的接单模式、工具选择、学员复制路径，以及AI定制开发对SaaS行业的冲击。

阅读全文 →