#MoE

共 236 篇相关文章

教程攻略

2026年6月2日·3 分钟

大模型工程师必备技能：应用开发与微调训练完整指南

系统梳理大模型工程师核心技能体系，涵盖RAG、Agent应用开发及SFT、RLHF微调训练两大方向，为Java后端、AI算法工程师及零基础转行者提供清晰的学习路径规划。

阅读全文 →

教程攻略

2026年6月2日·6 分钟

Claude Code接入DeepSeek：零门槛四步配置教程

详细教程教你用ccswitch工具将Claude Code接入DeepSeek模型，无需海外账号和信用卡，充值10元即可使用AI编程助手。涵盖安装、API配置、验证及常见问题排查。

阅读全文 →

教程攻略

2026年6月2日·10 分钟

llama.cpp MTP加速部署指南：配置步骤与性能实测

详解llama.cpp如何启用MTP多Token预测加速技术，涵盖CUDA环境配置、桌面端设置、模型选择及实测性能数据，Qwen3 27B实测近60 Token/s。

阅读全文 →

教程攻略

2026年6月2日·8 分钟

Codex对接DeepSeek V4模型完整教程：配置API与解锁插件

详细介绍Codex对接DeepSeek V4模型的完整流程，包括API Key获取、CC Switch中转配置、插件解锁等步骤，帮助国内用户以低成本使用AI编程与对话工具。

阅读全文 →

教程攻略

2026年6月2日·7 分钟

Zotero 9接入AI大模型：豆包与DeepSeek配置全攻略

详细介绍Zotero 9接入豆包和DeepSeek两种AI大模型方案的完整配置流程，实现论文总结、全文翻译、智能问答等功能，打造AI驱动的智能文献阅读环境。

阅读全文 →

教程攻略

2026年6月2日·7 分钟

DeepSeek-V3+VSCode搭建低成本AI代码编辑器教程

详细教程：用DeepSeek-V3 API配合VSCode的Continue插件，搭建低成本AI编程助手。涵盖安装配置、API Key获取、代码补全演示及Ollama本地部署零成本替代方案。

阅读全文 →

教程攻略

2026年6月2日·8 分钟

爱马仕Agent部署教程：比小龙虾更省Token的AI助手

详细介绍爱马仕（Hermes）Agent在Windows系统下的完整部署教程，包括环境准备、模型配置、微信通道连接及常见问题解决方案。相比小龙虾Agent，爱马仕Token消耗更低，支持微信直接对话。

阅读全文 →

Hermes协调DeepSeek+MiniMax双AI协作写代码：从零完成项目实测

教程攻略

2026年6月2日·9 分钟

Hermes协调DeepSeek+MiniMax双AI协作写代码：从零完成项目实测

实测用Hermes智能体协调DeepSeek V4和MiniMax 2.7两个AI模型协同编程，9分钟完成PDF导出功能，从零用Nim语言构建RSS聚合服务，探索多模型协作开发的实际效果与局限。

阅读全文 →

产品体验

2026年6月2日·5 分钟

DeepSeek满血版免费无限用？AI聚合平台深度实测与风险分析

深度分析声称可无限免费使用DeepSeek满血版R1模型的AI聚合平台，解析其多模型聚合、官方API直连等卖点，揭示数据安全与可持续性风险，并提供官方API、硅基流动等更稳妥的替代方案。

阅读全文 →

产品体验

2026年6月2日·10 分钟

Windsurf Wave 3全面解析：MCP支持、Turbo模式与多模型集成

深度解析Windsurf Wave 2和Wave 3重磅更新，涵盖MCP协议支持、Turbo自动模式、DeepSeek模型集成、Tab to Jump智能跳转等核心功能，附定价对比与Cursor使用体验评测。

阅读全文 →

产品体验

2026年6月2日·11 分钟

OpenHuman深度解析：上下文优先的开源私人AI Agent

深度解析OpenHuman开源私人AI Agent，详解其上下文优先架构、Rust+React混合方案、内存树记忆系统、Token Juice压缩引擎及多模型动态路由，全面评估其安全设计与竞品优势。

阅读全文 →

教程攻略

2026年6月1日·9 分钟

oMLX+MTP+Qwen3.6：本地AI编程速度突破新极限

使用oMLX推理引擎结合MTP多令牌预测技术和Qwen3.6 35B模型，在Apple Silicon Mac上实现86.7 tokens/s的本地编程速度，5分钟内完成全栈应用开发的完整实战解析。

阅读全文 →

AI周报：Claude Code代码审查、Gemma 4泄露与DeepSeek V4推迟

科技前沿

2026年6月1日·8 分钟

AI周报：Claude Code代码审查、Gemma 4泄露与DeepSeek V4推迟

本周AI重磅更新汇总：Anthropic推出Claude Code代码审查功能，Google Gemma 4开源模型意外泄露，DeepSeek V4发布再度推迟，微软Copilot Cowork重塑协作方式，以及OpenAI收购PromptFool等行业动态深度解析。

阅读全文 →

SGLang v0.5.12.post1发布：DeepSeek V4稳定性修复与Blackwell适配

科技前沿

2026年5月30日·6 分钟

SGLang v0.5.12.post1发布：DeepSeek V4稳定性修复与Blackwell适配

SGLang v0.5.12.post1稳定性补丁详解，包含12项关键修复，涵盖DeepSeek V4乱码与崩溃问题、NIXL PD分离式推理逻辑修复、Blackwell B300架构适配及冷启动性能优化。

阅读全文 →

科技前沿

2026年5月30日·7 分钟

Step 3.7 Flash：198B稀疏MoE多模态模型深度解析

深度解析StepFun AI发布的Step 3.7 Flash，一款198B参数稀疏MoE视觉语言模型，支持256K上下文与三级推理，在多模态理解、AI编程和Agent工具编排方面表现顶尖，已获SGLang首日支持。

阅读全文 →

Cloudflare向SGLang贡献KV Cache与Mooncake关键修复

科技前沿

2026年5月30日·5 分钟

Cloudflare向SGLang贡献KV Cache与Mooncake关键修复

Cloudflare向SGLang上游提交decode KV cache offload和Mooncake recovery两项关键修复，解决高并发场景下Kimi K2.6模型乱码输出问题，并实现分布式推理节点自动故障恢复，提升生产环境稳定性。

阅读全文 →

AMD MI355X击败B200：DeepSeek-R1推理TCO低5%的全栈优化解析

行业洞察

2026年5月30日·7 分钟

AMD MI355X击败B200：DeepSeek-R1推理TCO低5%的全栈优化解析

AMD Instinct MI355X通过SGLang+MoRI全栈优化，在DeepSeek-R1分离式推理中实现TCO比NVIDIA B200低5%，每GPU吞吐量高1.25倍。深度解析MoRI量化通信、KV Cache优化及推测解码等核心技术突破。

阅读全文 →

科技前沿

2026年5月30日·6 分钟

LFM2.5-8B-A1B：1.5B激活参数实现4倍体量效果的MoE模型

Liquid AI发布LFM2.5-8B-A1B模型，采用MoE架构，8B总参数仅激活1.5B，在工具调用场景中媲美6B级模型表现。支持128K上下文、本地部署、多语言，SGLang即时支持。

阅读全文 →

行业洞察

2026年5月30日·8 分钟

AI全自动编排实践：软件生产成本如何被彻底打穿

深度解析AI全自动软件编排的实践方法：从Claude Code工作流到并行编排策略，探讨MiniMax M1等小参数模型如何让软件生产边际成本趋近于零，以及普通人如何抓住这波AI编程红利。

阅读全文 →

行业洞察

2026年5月29日·9 分钟

大模型三大岗位深度解析：门槛、技术栈与职业前景

深度解析大模型应用工程师、研发工程师、算法工程师三大核心岗位的技术要求、薪资门槛与发展前景，涵盖RAG、模型微调、推理部署等关键技术栈，助你制定清晰的AI职业规划路径。

阅读全文 →