#显存不足

共 15 篇相关文章

产品体验

2026年6月3日·9 分钟

Google Gemma 4实测：手机离线运行+Ollama部署教程

实测Google Gemma 4开源模型在三台手机上的离线运行表现，详解Dense与MOE架构区别，附Ollama + Claude Code完整部署教程。从1B到31B四款模型覆盖手机到工作站全场景，4GB显存即可运行。

阅读全文 →

教程攻略

2026年5月28日·9 分钟

大模型命名规则解析：参数量、量化格式与显存需求速查

系统拆解大模型命名规则，解释32B参数量、AWQ/GGUF量化格式的含义，提供4-bit量化显存估算公式与速查表，涵盖MOE模型显存陷阱、IMatrix量化推荐及按显存档位的模型选择建议。

阅读全文 →

教程攻略

2026年5月21日·6 分钟

本地部署大模型怎么判断显存爆了？一文看懂显存监控方法

本地部署大模型时如何判断显存是否爆满？本文详解专用显存与共享GPU内存的区别，教你通过任务管理器快速判断显存溢出，并提供模型量化、上下文长度控制等避免爆显存的实用建议。

阅读全文 →

本地部署DeepSeek+RAG知识库教程：Ollama+RAGFlow保姆级指南

教程攻略

2026年5月21日·6 分钟

本地部署DeepSeek+RAG知识库教程：Ollama+RAGFlow保姆级指南

手把手教你用Ollama本地部署DeepSeek大模型，结合RAGFlow搭建RAG私有知识库。涵盖环境配置、Docker部署、Embedding原理讲解，支持离线运行，保障数据隐私，轻松实现企业级智能问答。

阅读全文 →

Pixal3D实测对比Tripl3/Trellis/Hunyuan：像素级对齐优劣全解析

产品体验

2026年5月21日·8 分钟

Pixal3D实测对比Tripl3/Trellis/Hunyuan：像素级对齐优劣全解析

深度实测腾讯开源3D生成模型Pixal3D，解析像素级对齐技术原理，与Trellis 2、Hunyuan、Tripl3多组对比评测。涵盖本地部署教程、24GB显存需求、优劣势分析及商业许可争议解读。

阅读全文 →

教程攻略

2026年5月16日·10 分钟

Codex+Ollama本地部署教程：零成本搭建AI编程助手

手把手教你用Codex搭配Ollama在本地部署免费AI编程助手，涵盖硬件检测、Ollama安装、Gemma/Qwen模型下载与接入配置全流程，轻松实现隐私安全的本地AI编程工作流。

阅读全文 →

教程攻略

2026年5月15日·12 分钟

Whisper本地部署教程：手把手搭建免费语音转文字工具

详细图文教程教你在本地部署OpenAI Whisper语音识别工具，涵盖Conda环境配置、PyTorch安装、模型选择到实际转录操作全流程，支持近百种语言，免费生成SRT字幕文件。

阅读全文 →

教程攻略

2026年5月15日·8 分钟

GPT-OSS本地部署教程：Ollama一键运行OpenAI开源模型

详解OpenAI开源模型GPT-OSS的本地部署方法，涵盖20B/120B版本对比、Ollama安装配置、硬件要求及实测效果，助你在家用电脑上离线运行接近ChatGPT水平的AI模型。

阅读全文 →

教程攻略

2026年5月15日·9 分钟

一个Prompt搭建本地生图MCP Server，让Codex批量生成编辑图片

详解如何用一个Prompt搭建本地图像生成MCP Server，让Codex调用Flux模型实现零Token消耗的批量图片生成与编辑，附完整搭建步骤和实测效果。

阅读全文 →

AI周报：Qwen3VL本地部署、Karpathy Agent观点与AI炒币实验

观点碰撞

2026年5月15日·9 分钟

AI周报：Qwen3VL本地部署、Karpathy Agent观点与AI炒币实验

AI周报终章涵盖Qwen3VL多版本发布及M1 MacBook本地部署实测、Claude Haiku 4.5编程能力评测、Karpathy nano-chat开源项目与Agent十年论、Nof1让7个AI模型用真金白银炒币的社会实验，以及AI生成内容超越人类产出的深度观察。

阅读全文 →

产品体验

2026年5月8日·8 分钟

Cube Studio：腾讯开源一站式AI平台，MLOps全流程深度解析

深度解析腾讯音乐开源的Cube Studio云原生AI平台，涵盖Notebook开发、Pipeline编排、分布式训练、大模型微调、推理部署及国产化适配等核心能力，助力企业快速构建MLOps全流程基础设施。

阅读全文 →

产品体验

2026年5月7日·12 分钟

Cube Studio深度解析：腾讯开源一站式云原生AI平台

深度解析腾讯开源AI平台Cube Studio，覆盖分布式训练、大模型微调、推理部署、VGPU虚拟化及国产化适配等核心功能，帮助企业构建MLOps全流程一站式AI基础设施。

阅读全文 →

产品体验

2026年5月6日·12 分钟

Unsloth：本地微调大模型速度提升5倍的开源利器

Unsloth是GitHub 63K+星标的开源大模型微调工具，支持Gemma 4、Qwen 3、DeepSeek等主流模型，通过LoRA/QLoRA技术将训练速度提升2-5倍，显存降低80%，提供Web UI界面让本地微调大模型变得简单高效。

阅读全文 →

产品体验

2026年5月6日·13 分钟

Unsloth：本地微调大模型速度提升5倍的开源神器

Unsloth 是 GitHub 63000+ Star 的开源大模型训练工具，支持 Gemma 4、Qwen3、DeepSeek 等主流模型的本地微调，提供 Web UI 界面、显存优化和 2-5 倍训练加速，让消费级 GPU 也能跑通模型微调全流程。

阅读全文 →

产品体验

2026年5月5日·14 分钟

Cube Studio：腾讯开源一站式AI平台，大模型训练到推理全覆盖

深度解析腾讯音乐开源的Cube Studio云原生AI平台，涵盖分布式训练、DeepSeek大模型微调、vLLM推理部署、VGPU算力管理等核心功能，支持华为昇腾国产化生态，助力企业构建私有AI基础设施。

阅读全文 →