共 236 篇相关文章
教程攻略系统梳理大模型工程师核心技能体系,涵盖RAG、Agent应用开发及SFT、RLHF微调训练两大方向,为Java后端、AI算法工程师及零基础转行者提供清晰的学习路径规划。
教程攻略详细教程教你用ccswitch工具将Claude Code接入DeepSeek模型,无需海外账号和信用卡,充值10元即可使用AI编程助手。涵盖安装、API配置、验证及常见问题排查。
教程攻略详解llama.cpp如何启用MTP多Token预测加速技术,涵盖CUDA环境配置、桌面端设置、模型选择及实测性能数据,Qwen3 27B实测近60 Token/s。
教程攻略详细介绍Codex对接DeepSeek V4模型的完整流程,包括API Key获取、CC Switch中转配置、插件解锁等步骤,帮助国内用户以低成本使用AI编程与对话工具。
教程攻略详细介绍Zotero 9接入豆包和DeepSeek两种AI大模型方案的完整配置流程,实现论文总结、全文翻译、智能问答等功能,打造AI驱动的智能文献阅读环境。
教程攻略详细教程:用DeepSeek-V3 API配合VSCode的Continue插件,搭建低成本AI编程助手。涵盖安装配置、API Key获取、代码补全演示及Ollama本地部署零成本替代方案。
教程攻略详细介绍爱马仕(Hermes)Agent在Windows系统下的完整部署教程,包括环境准备、模型配置、微信通道连接及常见问题解决方案。相比小龙虾Agent,爱马仕Token消耗更低,支持微信直接对话。
教程攻略实测用Hermes智能体协调DeepSeek V4和MiniMax 2.7两个AI模型协同编程,9分钟完成PDF导出功能,从零用Nim语言构建RSS聚合服务,探索多模型协作开发的实际效果与局限。
产品体验深度分析声称可无限免费使用DeepSeek满血版R1模型的AI聚合平台,解析其多模型聚合、官方API直连等卖点,揭示数据安全与可持续性风险,并提供官方API、硅基流动等更稳妥的替代方案。
产品体验深度解析Windsurf Wave 2和Wave 3重磅更新,涵盖MCP协议支持、Turbo自动模式、DeepSeek模型集成、Tab to Jump智能跳转等核心功能,附定价对比与Cursor使用体验评测。
产品体验深度解析OpenHuman开源私人AI Agent,详解其上下文优先架构、Rust+React混合方案、内存树记忆系统、Token Juice压缩引擎及多模型动态路由,全面评估其安全设计与竞品优势。
教程攻略使用oMLX推理引擎结合MTP多令牌预测技术和Qwen3.6 35B模型,在Apple Silicon Mac上实现86.7 tokens/s的本地编程速度,5分钟内完成全栈应用开发的完整实战解析。
科技前沿本周AI重磅更新汇总:Anthropic推出Claude Code代码审查功能,Google Gemma 4开源模型意外泄露,DeepSeek V4发布再度推迟,微软Copilot Cowork重塑协作方式,以及OpenAI收购PromptFool等行业动态深度解析。
科技前沿SGLang v0.5.12.post1稳定性补丁详解,包含12项关键修复,涵盖DeepSeek V4乱码与崩溃问题、NIXL PD分离式推理逻辑修复、Blackwell B300架构适配及冷启动性能优化。
科技前沿深度解析StepFun AI发布的Step 3.7 Flash,一款198B参数稀疏MoE视觉语言模型,支持256K上下文与三级推理,在多模态理解、AI编程和Agent工具编排方面表现顶尖,已获SGLang首日支持。
科技前沿Cloudflare向SGLang上游提交decode KV cache offload和Mooncake recovery两项关键修复,解决高并发场景下Kimi K2.6模型乱码输出问题,并实现分布式推理节点自动故障恢复,提升生产环境稳定性。
行业洞察AMD Instinct MI355X通过SGLang+MoRI全栈优化,在DeepSeek-R1分离式推理中实现TCO比NVIDIA B200低5%,每GPU吞吐量高1.25倍。深度解析MoRI量化通信、KV Cache优化及推测解码等核心技术突破。
科技前沿Liquid AI发布LFM2.5-8B-A1B模型,采用MoE架构,8B总参数仅激活1.5B,在工具调用场景中媲美6B级模型表现。支持128K上下文、本地部署、多语言,SGLang即时支持。