共 6 篇相关文章

MiniMax M3模型正式上线Fireworks平台,支持512K超长上下文和多模态输入,MSA稀疏注意力机制实现预填充9倍、解码15倍加速。深度解析其技术架构、定价策略及开源模型竞争格局。

Fireworks AI正式上线Qwen 3.7 Plus模型,提供延迟吞吐量优化、零数据留存、99.9% SLA企业级保障。了解开源模型商业化推理服务的全栈部署方案与行业竞争格局。

深入解析Qwen3-Coder模型的核心能力:11小时连续运行、1万行代码生成、1000+次调用。详解其长程Agent循环架构、推理上下文持久化、思考模式切换等关键技术,以及在Fireworks平台上的部署实践与成本分析。

Moonshot发布K2.7 Code编码模型,相比K2.6推理token消耗减少30%,编码基准测试得分更高。已在Fireworks平台上线,支持无服务器部署和API调用,显著优化智能体编码工作流的成本与效率。

Fireworks AI训练平台新增NVIDIA Nemotron 3 Ultra后训练支持,提供SFT、DPO、LoRA及全参数微调,实现训练即部署的无缝工作流,助力开发者快速定制开放权重大模型。
科技前沿OpenAI Codex推出Switch to Codex迁移功能和宠物功能,xAI语音克隆、Anthropic估值冲击9000亿、美国国防部AI部署协议等重磅消息一文看完。