#CUDA

共 119 篇相关文章

科技前沿

2026年5月14日·6 分钟

NVIDIA开发者账号迁移至@NVIDIAAI：品牌整合与开发者影响全解析

NVIDIA开发者团队官方社交媒体账号已迁移至@NVIDIAAI统一发布。本文解析此次品牌整合背后的AI战略逻辑，对开发者社区的具体影响，以及开发者需要采取的行动建议。

阅读全文 →

教程攻略

2026年5月14日·7 分钟

Gemma 4部署DGX Spark实战：本地AI超算+开源大模型全解析

深度解析Google Gemma 4模型在NVIDIA DGX Spark上的部署方案。涵盖DGX Spark硬件架构、Gemma 4技术亮点、本地AI部署优势及开发者实践指南，助你掌握桌面级AI超算的最新玩法。

阅读全文 →

观点碰撞

2026年5月14日·6 分钟

红杉资本对话AI专家：冯·诺依曼架构如何影响AI未来发展

红杉资本与AI专家Konstantine深度对话，探讨冯·诺依曼架构对现代人工智能的深远影响。从计算范式演进到AGI追求，解析顶级VC的AI投资逻辑与基础理论回归趋势。

阅读全文 →

深度解读

2026年5月13日·8 分钟

微软Tutel：MoE模型加速库深度解析，支持FP4/FP8低精度计算

深度解析微软开源Tutel MoE优化库，支持FP8、NVFP4、MXFP4多精度计算，适配DeepSeek、Kimi-K2、Qwen3等主流MoE模型，解决All-to-All通信瓶颈与显存管理难题。

阅读全文 →

4-bit QLoRA微调LLaMA 3实战：消费级GPU训练80亿参数大模型指南

教程攻略

2026年5月13日·10 分钟

4-bit QLoRA微调LLaMA 3实战：消费级GPU训练80亿参数大模型指南

详解如何使用QLoRA和Unsloth框架在消费级GPU上微调LLaMA 3 8B大模型。涵盖4-bit量化、LoRA低秩适配、Alpaca数据格式、训练流水线搭建到模型部署的完整流程，RTX 3090即可运行。

阅读全文 →

ComfyUI-Copilot：用自然语言构建Stable Diffusion工作流的AI助手

产品体验

2026年5月13日·11 分钟

ComfyUI-Copilot：用自然语言构建Stable Diffusion工作流的AI助手

ComfyUI-Copilot是一款开源AI智能助手插件，支持自然语言构建ComfyUI工作流、智能节点推荐和参数优化。GitHub 5100+ Star，大幅降低Stable Diffusion工作流搭建门槛，提升AIGC创作效率。

阅读全文 →

前沿研究

2026年5月13日·9 分钟

SVDQuant：4-bit量化让扩散模型在消费级GPU上高效运行

SVDQuant是ICLR 2025 Spotlight论文，通过低秩分解吸收异常值实现扩散模型4-bit量化，显存降低75%。开源项目Nunchaku获3800+ Stars，让FLUX等大型图像生成模型在RTX 4060等中端显卡上流畅推理。

阅读全文 →

教程攻略

2026年5月13日·9 分钟

从零搭建AI数字人Agent：架构设计与全流程技术拆解

详解AI数字人Agent搭建全流程，涵盖Agent智能体、RAG检索增强生成、WebRTC实时通信、Docker部署四大核心技术栈，附架构设计思路与工程化实践方案，助你快速构建智能对话数字人系统。

阅读全文 →

StabilityMatrix：一键安装管理Stable Diffusion的开源神器

教程攻略

2026年5月10日·9 分钟

StabilityMatrix：一键安装管理Stable Diffusion的开源神器

StabilityMatrix是一款开源跨平台Stable Diffusion包管理器，支持一键安装WebUI、ComfyUI等主流前端，提供统一模型管理、版本控制等功能，帮助AI绘画用户告别繁琐的环境配置，GitHub已获8100+ Star。

阅读全文 →

产品体验

2026年5月8日·9 分钟

AnythingLLM完全指南：本地部署的隐私AI助手

深度解析AnythingLLM开源项目，一款隐私优先、零配置的本地AI生产力工具。支持RAG知识库、多模型切换、文档对话，GitHub近6万Star，适合企业和个人本地部署使用。

阅读全文 →

教程攻略

2026年5月8日·7 分钟

Ollama教程：一键本地部署DeepSeek、Qwen等大模型

详解Ollama本地运行大模型的完整指南，支持DeepSeek、Qwen、Kimi-K2.5等主流开源模型，涵盖安装使用、模型生态、隐私优势及企业私有化部署场景，GitHub 17万Star的热门开源工具。

阅读全文 →

教程攻略

2026年5月8日·6 分钟

Unsloth教程：本地微调大模型省显存提速5倍

详解Unsloth开源工具如何通过LoRA优化和Web UI界面，让消费级显卡也能高效微调Gemma 4、Qwen3、DeepSeek等主流大模型，训练速度提升2-5倍，显存降低50%-70%。

阅读全文 →

教程攻略

2026年5月8日·7 分钟

Unsloth教程：本地微调大模型速度提升数倍，显存节省60%

Unsloth是GitHub 63K星标的开源大模型微调工具，支持Gemma 4、Qwen3、DeepSeek等模型。通过底层内核优化实现训练加速数倍、显存大幅降低，消费级GPU即可完成微调，提供Web UI图形界面，适合个人开发者和企业私有化部署。

阅读全文 →

教程攻略

2026年5月8日·7 分钟

Unsloth教程：本地微调大模型省显存加速训练指南

详解Unsloth开源工具如何在本地高效微调大模型，支持Gemma 4、Qwen3、DeepSeek等主流模型，通过LoRA优化显著降低显存占用，提供Web UI界面降低训练门槛，适合个人开发者和中小团队使用。

阅读全文 →

产品体验

2026年5月8日·5 分钟

Unsloth：本地微调大模型的高效开源工具

Unsloth是GitHub上超63000星的开源项目，提供Web UI界面支持本地训练和微调Gemma 4、Qwen3、DeepSeek等主流大模型，大幅降低硬件门槛和技术难度，适合个人开发者和企业私有化部署。

阅读全文 →

教程攻略

2026年5月7日·7 分钟

Ollama教程：本地一键运行DeepSeek、Qwen等大模型完整指南

详解Ollama开源工具的安装使用方法，支持DeepSeek、Qwen、Kimi-K2.5、GLM-5等主流大模型本地部署，17万Star的最受欢迎本地大模型运行框架，助你实现离线AI推理与隐私保护。

阅读全文 →

深度解读

2026年5月7日·3 分钟

AI基础知识开源宝库：从GPU架构到AI Agent全覆盖

阅读全文 →

教程攻略

2026年5月7日·8 分钟

Ollama教程：本地运行DeepSeek等大模型的最简方案

详解Ollama本地部署大模型的完整指南，支持DeepSeek、Qwen、Kimi-K2.5等主流模型。了解这款17万Star开源工具如何实现一键安装、离线推理，以及适用场景与生态集成方案。

阅读全文 →

产品体验

2026年5月7日·12 分钟

Cube Studio深度解析：腾讯开源一站式云原生AI平台

深度解析腾讯开源AI平台Cube Studio，覆盖分布式训练、大模型微调、推理部署、VGPU虚拟化及国产化适配等核心功能，帮助企业构建MLOps全流程一站式AI基础设施。

阅读全文 →

教程攻略

2026年5月7日·9 分钟

AnythingLLM完全指南：本地部署的隐私AI生产力平台

深度解析AnythingLLM开源AI平台，涵盖本地部署、RAG文档对话、知识库管理等核心功能。支持Ollama等多模型后端，零配置开箱即用，6万Star验证的隐私优先AI生产力工具。

阅读全文 →