#MOE模型

共 33 篇相关文章

产品体验

2026年6月3日·9 分钟

Google Gemma 4实测：手机离线运行+Ollama部署教程

实测Google Gemma 4开源模型在三台手机上的离线运行表现，详解Dense与MOE架构区别，附Ollama + Claude Code完整部署教程。从1B到31B四款模型覆盖手机到工作站全场景，4GB显存即可运行。

阅读全文 →

教程攻略

2026年6月2日·10 分钟

llama.cpp MTP加速部署指南：配置步骤与性能实测

详解llama.cpp如何启用MTP多Token预测加速技术，涵盖CUDA环境配置、桌面端设置、模型选择及实测性能数据，Qwen3 27B实测近60 Token/s。

阅读全文 →

教程攻略

2026年6月2日·7 分钟

DeepSeek-V3+VSCode搭建低成本AI代码编辑器教程

详细教程：用DeepSeek-V3 API配合VSCode的Continue插件，搭建低成本AI编程助手。涵盖安装配置、API Key获取、代码补全演示及Ollama本地部署零成本替代方案。

阅读全文 →

AI周报：Claude Code代码审查、Gemma 4泄露与DeepSeek V4推迟

科技前沿

2026年6月1日·8 分钟

AI周报：Claude Code代码审查、Gemma 4泄露与DeepSeek V4推迟

本周AI重磅更新汇总：Anthropic推出Claude Code代码审查功能，Google Gemma 4开源模型意外泄露，DeepSeek V4发布再度推迟，微软Copilot Cowork重塑协作方式，以及OpenAI收购PromptFool等行业动态深度解析。

阅读全文 →

Cloudflare向SGLang贡献KV Cache与Mooncake关键修复

科技前沿

2026年5月30日·5 分钟

Cloudflare向SGLang贡献KV Cache与Mooncake关键修复

Cloudflare向SGLang上游提交decode KV cache offload和Mooncake recovery两项关键修复，解决高并发场景下Kimi K2.6模型乱码输出问题，并实现分布式推理节点自动故障恢复，提升生产环境稳定性。

阅读全文 →

科技前沿

2026年5月30日·6 分钟

LFM2.5-8B-A1B：1.5B激活参数实现4倍体量效果的MoE模型

Liquid AI发布LFM2.5-8B-A1B模型，采用MoE架构，8B总参数仅激活1.5B，在工具调用场景中媲美6B级模型表现。支持128K上下文、本地部署、多语言，SGLang即时支持。

阅读全文 →

行业洞察

2026年5月29日·9 分钟

大模型三大岗位深度解析：门槛、技术栈与职业前景

深度解析大模型应用工程师、研发工程师、算法工程师三大核心岗位的技术要求、薪资门槛与发展前景，涵盖RAG、模型微调、推理部署等关键技术栈，助你制定清晰的AI职业规划路径。

阅读全文 →

科技前沿

2026年5月28日·6 分钟

AI周报：Kimi K2.6登顶开源榜，Qwen 3.6与谷歌TTS齐发

本周AI重磅发布汇总：Kimi K2.6登顶开源模型排行榜，Anthropic推出Opus 4.7与Claude Design，阿里Qwen 3.6系列全面铺开，谷歌发布情感可控TTS模型。深度解读开源与闭源模型竞争新格局。

阅读全文 →

产品体验

2026年5月28日·9 分钟

Mac本地跑Qwen3.6-27B：4种方案实测对比

实测对比Mac本地运行Qwen3.6-27B的4种方案，包括GGUF、MLX Diflash和MTP-LX。MTP-LX 4bit方案以43.6 tok/s速度领先，编码、写作、推理质量均可圈可点，附安装配置指南。

阅读全文 →

前沿研究

2026年5月27日·7 分钟

Cursor Composer 2训练揭秘：分布式强化学习架构全解析

深度解析Cursor如何在Fireworks上训练Composer 2模型，涵盖异步流水线架构、MoE模型数值精度挑战、Router Replay技术、全球分布式GPU集群协同等核心技术方案，揭示AI编程工具从应用公司迈向基础模型公司的关键路径。

阅读全文 →

前沿研究

2026年5月26日·5 分钟

Cursor Composer 2分布式RL训练技术解析

深度解析Cursor如何通过分布式强化学习训练Composer 2模型，涵盖异步流水线设计、MoE数值对齐、全球权重同步、在线离线RL协同等核心技术细节，揭示AI编程工具从应用到基础模型的转型路径。

阅读全文 →

产品体验

2026年5月23日·5 分钟

免魔法使用DeepSeek、GPT、Claude等AI模型实测体验

实测免魔法AI聚合平台，验证满血DeepSeek 671B、Gemini文件分析、音视频识别及联网搜索功能，一站式访问GPT、Claude等热门模型的真实体验报告。

阅读全文 →

产品体验

2026年5月23日·1 分钟

MiniMax M2.5实测：10B参数如何跑出旗舰级编程能力

实测MiniMax M2.5在Claude Code中的编程表现，包括3D游戏开发、AI翻译平台搭建等场景，对比Claude Opus和GPT-5.2，解析10B参数模型如何实现高性价比编程能力。

阅读全文 →

AI周报：Codex子代理、MiniMax M2.7、英伟达GTC与Claude百万token窗口

科技前沿

2026年5月23日·4 分钟

AI周报：Codex子代理、MiniMax M2.7、英伟达GTC与Claude百万token窗口

本周AI重磅更新汇总：OpenAI Codex推出子代理并行编码功能，MiniMax M2.7开源模型即将发布，英伟达GTC发布Neutron Ultra与DLSS 5，Claude Code升级至百万token上下文窗口，全面解读行业最新动态。

阅读全文 →

产品体验

2026年5月23日·6 分钟

DeepSeek V4编码实测：榜单第一Kimi翻车，Claude稳居最强

用同一个全栈小游戏任务实测DeepSeek V4、Claude Opus、GPT和Kimi K2.6四大AI编程模型。榜单排名第一的Kimi K2.6全部失败，Claude Opus一次通过。深度解读DeepSeek V4论文核心技术创新与真实编码选型建议。

阅读全文 →

教程攻略

2026年5月22日·5 分钟

Qwen3-0.6B微调入门：大模型基础概念与微调方法论详解

从大模型三大核心特征讲起，系统梳理Qwen3-0.6B微调所需的基础知识，包括大模型与应用软件的区别、国内外主流模型对比、微调价值分析，以及从原理到实操的完整学习路径。

阅读全文 →

LangChain LCEL表达式语言详解：管道操作符、RunnableLambda与并行执行实战

教程攻略

2026年5月22日·8 分钟

LangChain LCEL表达式语言详解：管道操作符、RunnableLambda与并行执行实战

深入解析LangChain LCEL表达式语言的核心概念，涵盖管道操作符底层原理、RunnableLambda函数包装、RunnableParallel并行检索及RunnablePassThrough透传机制，附完整代码示例与RAG多源检索实战。

阅读全文 →

产品体验

2026年5月22日·5 分钟

QwenCoder本地部署实测：能否替代付费AI编程助手？

实测QwenCoder 80B本地部署效果，对比Gemini、Claude等付费AI编程工具。详解硬件配置、LM Studio部署方案及实际编程能力测试结果，帮你判断本地模型能否省下AI订阅费。

阅读全文 →

教程攻略

2026年5月21日·4 分钟

DeepSeek+Cursor+DevBox：零基础也能完成项目开发部署

详解DeepSeek+Cursor+DevBox零代码开发流程，从项目设计、数据库建模、前后端代码生成到一键部署上线，零基础小白也能独立完成完整项目交付，附适用人群与实操步骤。

阅读全文 →

科技前沿

2026年5月21日·5 分钟

Qwen3.7 Max深度解读：1T参数MoE架构与智能体全框架兼容

深度解析阿里Qwen3.7 Max大模型：1T参数MoE架构、256K上下文窗口、智能体编程能力全面领先。详解其全框架兼容策略、多语言Token经济布局，以及模型能力与Harness依赖的行业争论。

阅读全文 →