#开源大模型

共 122 篇相关文章

科技前沿

2026年5月15日·9 分钟

Gemma 4 + DGX Spark：开源大模型与桌面级算力如何改变AI开发

NVIDIA与Google DeepMind联合展示Gemma 4开源模型在DGX Spark桌面平台上的视觉翻译、长上下文问答和实时代码生成能力，解读开源AI与边缘算力融合的产业趋势及开发者实际启示。

阅读全文 →

NVIDIA Nemotron Labs开源贡献指南：开发者参与AI开源项目全攻略

教程攻略

2026年5月14日·8 分钟

NVIDIA Nemotron Labs开源贡献指南：开发者参与AI开源项目全攻略

详解NVIDIA Nemotron Labs开源贡献路径，涵盖NeMo框架、Nemotron模型的代码贡献、文档完善、社区参与等方式，帮助开发者快速融入NVIDIA AI开源生态，提升技术能力与职业竞争力。

阅读全文 →

教程攻略

2026年5月14日·7 分钟

Gemma 4部署DGX Spark实战：本地AI超算+开源大模型全解析

深度解析Google Gemma 4模型在NVIDIA DGX Spark上的部署方案。涵盖DGX Spark硬件架构、Gemma 4技术亮点、本地AI部署优势及开发者实践指南，助你掌握桌面级AI超算的最新玩法。

阅读全文 →

前沿研究

2026年5月13日·8 分钟

多智能体AI检测CVE零日漏洞利用：85%准确率背后的技术解析

深入解析开源项目ai-detects-if-cve-was-zero-day的多智能体架构，了解GPT-4o、DeepSeek v3和Llama 3.3如何协同检测CVE零日漏洞利用，在50个验证样本上实现85%以上准确率，探讨其技术原理、应用场景与局限性。

阅读全文 →

IBM Granite 4.1开源模型：21种GGUF量化版本SVG生成实测对比

产品体验

2026年5月13日·6 分钟

IBM Granite 4.1开源模型：21种GGUF量化版本SVG生成实测对比

IBM发布Granite 4.1系列Apache 2.0开源大模型，Unsloth提供21种GGUF量化变体。Simon Willison用鹈鹕骑自行车SVG提示词逐一测试，揭示3B模型量化精度与输出质量的真实关系。

阅读全文 →

产品体验

2026年5月13日·7 分钟

Unsloth：显存优化80%，本地微调大模型的最佳开源工具

Unsloth是GitHub 63K+ Star的开源大模型训练工具，支持Gemma 4、Qwen 3、DeepSeek等主流模型。通过显存优化降低50%-80%显存占用，让RTX 4090也能微调7B模型，提供Web UI一键训练。

阅读全文 →

产品体验

2026年5月13日·8 分钟

Open WebUI：13万Star开源AI界面，部署教程与功能全解析

深度解析Open WebUI这款13.5万Star的开源AI交互界面，涵盖Ollama集成、Docker一键部署、RAG文档问答、多用户管理等核心功能，助你快速搭建本地AI助手或企业AI平台。

阅读全文 →

教程攻略

2026年5月13日·9 分钟

Coze智能体搭建教程：从零开始创建AI Agent完整指南

详细讲解Coze（扣子）平台从零搭建AI智能体的完整流程，包括大模型配置、提示词编写、插件集成、知识库搭建、记忆系统设置等核心模块，零基础也能快速上手。

阅读全文 →

科技前沿

2026年5月13日·8 分钟

Threads无法屏蔽Meta AI账号：强推AI引发用户权益争议

Meta在Threads平台测试AI账号功能，用户可@Meta AI获取信息，但无法屏蔽该账号。这一设计引发用户自主权、隐私保护和平台治理等多层面争议，折射出科技巨头强推AI整合的行业趋势。

阅读全文 →

科技前沿

2026年5月12日·6 分钟

DeepSeek V3.2发布：自研稀疏注意力DSA+API降价50%全解析

DeepSeek发布V3.2-Exp实验版模型，首次引入自研DeepSeek Sparse Attention（DSA）稀疏注意力技术，大幅提升长上下文训练与推理效率，同时API价格下调超50%。本文详解DSA技术原理、模型架构演进及商业策略。

阅读全文 →

DeepSeek-V3.2-Exp发现RoPE实现Bug：交错格式不匹配导致推理性能下降

科技前沿

2026年5月12日·6 分钟

DeepSeek-V3.2-Exp发现RoPE实现Bug：交错格式不匹配导致推理性能下降

DeepSeek-V3.2-Exp推理演示中发现RoPE旋转位置编码的交错格式不匹配Bug，Indexer模块与MLA注意力模块的输入格式不一致导致隐性性能退化。本文详解问题根源、技术细节及修复方案。

阅读全文 →

科技前沿

2026年5月12日·7 分钟

DeepSeek-V4发布：1.6T参数+百万上下文，开源模型新标杆

DeepSeek-V4 Preview正式发布并开源，包含V4-Pro（1.6T参数）和V4-Flash（284B参数）两个版本，支持100万token上下文长度。本文详解V4架构特性、性能定位、开源部署方式及行业影响。

阅读全文 →

教程攻略

2026年5月11日·9 分钟

Flowise教程：拖拽式构建AI Agent的开源可视化编排工具

深入解析Flowise开源项目，一款基于LangChain的可视化AI Agent构建工具。支持拖拽式编排LLM应用、RAG知识库问答、多工具Agent开发，GitHub超5.2万Star，零代码快速搭建智能应用。

阅读全文 →

产品体验

2026年5月10日·7 分钟

Micro-Agent：复旦开源轻量级AI Agent框架，专为垂直领域打造

Micro-Agent是复旦大学开源的轻量级AI Agent框架，专注垂直领域应用开发。相比LangChain等重量级框架，它以精简架构、低学习成本和高定制灵活性为特色，适合医疗、法律、金融等垂域AI应用快速落地。

阅读全文 →

科技前沿

2026年5月9日·8 分钟

Kimi-K2.5开源：月之暗面最强模型来了，GitHub星标飙升

月之暗面正式开源旗舰模型Kimi-K2.5，GitHub星标突破1900。本文解读Kimi-K2.5的战略意义、技术生态、与DeepSeek和Qwen的竞争格局，以及开发者如何快速上手这款国产开源大模型。

阅读全文 →

教程攻略

2026年5月8日·7 分钟

Ollama教程：一键本地部署DeepSeek、Qwen等大模型

详解Ollama本地运行大模型的完整指南，支持DeepSeek、Qwen、Kimi-K2.5等主流开源模型，涵盖安装使用、模型生态、隐私优势及企业私有化部署场景，GitHub 17万Star的热门开源工具。

阅读全文 →

教程攻略

2026年5月8日·6 分钟

Unsloth教程：本地微调大模型省显存提速5倍

详解Unsloth开源工具如何通过LoRA优化和Web UI界面，让消费级显卡也能高效微调Gemma 4、Qwen3、DeepSeek等主流大模型，训练速度提升2-5倍，显存降低50%-70%。

阅读全文 →

教程攻略

2026年5月8日·7 分钟

Unsloth教程：本地微调大模型速度提升数倍，显存节省60%

Unsloth是GitHub 63K星标的开源大模型微调工具，支持Gemma 4、Qwen3、DeepSeek等模型。通过底层内核优化实现训练加速数倍、显存大幅降低，消费级GPU即可完成微调，提供Web UI图形界面，适合个人开发者和企业私有化部署。

阅读全文 →

产品体验

2026年5月8日·8 分钟

Cube Studio：腾讯开源一站式AI平台，MLOps全流程深度解析

深度解析腾讯音乐开源的Cube Studio云原生AI平台，涵盖Notebook开发、Pipeline编排、分布式训练、大模型微调、推理部署及国产化适配等核心能力，助力企业快速构建MLOps全流程基础设施。

阅读全文 →

教程攻略

2026年5月8日·7 分钟

Unsloth教程：本地微调大模型省显存加速训练指南

详解Unsloth开源工具如何在本地高效微调大模型，支持Gemma 4、Qwen3、DeepSeek等主流模型，通过LoRA优化显著降低显存占用，提供Web UI界面降低训练门槛，适合个人开发者和中小团队使用。

阅读全文 →