共 15 篇相关文章
产品体验实测Google Gemma 4开源模型在三台手机上的离线运行表现,详解Dense与MOE架构区别,附Ollama + Claude Code完整部署教程。从1B到31B四款模型覆盖手机到工作站全场景,4GB显存即可运行。
教程攻略系统拆解大模型命名规则,解释32B参数量、AWQ/GGUF量化格式的含义,提供4-bit量化显存估算公式与速查表,涵盖MOE模型显存陷阱、IMatrix量化推荐及按显存档位的模型选择建议。
教程攻略本地部署大模型时如何判断显存是否爆满?本文详解专用显存与共享GPU内存的区别,教你通过任务管理器快速判断显存溢出,并提供模型量化、上下文长度控制等避免爆显存的实用建议。
教程攻略手把手教你用Ollama本地部署DeepSeek大模型,结合RAGFlow搭建RAG私有知识库。涵盖环境配置、Docker部署、Embedding原理讲解,支持离线运行,保障数据隐私,轻松实现企业级智能问答。
产品体验深度实测腾讯开源3D生成模型Pixal3D,解析像素级对齐技术原理,与Trellis 2、Hunyuan、Tripl3多组对比评测。涵盖本地部署教程、24GB显存需求、优劣势分析及商业许可争议解读。
教程攻略手把手教你用Codex搭配Ollama在本地部署免费AI编程助手,涵盖硬件检测、Ollama安装、Gemma/Qwen模型下载与接入配置全流程,轻松实现隐私安全的本地AI编程工作流。
教程攻略详细图文教程教你在本地部署OpenAI Whisper语音识别工具,涵盖Conda环境配置、PyTorch安装、模型选择到实际转录操作全流程,支持近百种语言,免费生成SRT字幕文件。
教程攻略详解OpenAI开源模型GPT-OSS的本地部署方法,涵盖20B/120B版本对比、Ollama安装配置、硬件要求及实测效果,助你在家用电脑上离线运行接近ChatGPT水平的AI模型。
教程攻略详解如何用一个Prompt搭建本地图像生成MCP Server,让Codex调用Flux模型实现零Token消耗的批量图片生成与编辑,附完整搭建步骤和实测效果。
观点碰撞AI周报终章涵盖Qwen3VL多版本发布及M1 MacBook本地部署实测、Claude Haiku 4.5编程能力评测、Karpathy nano-chat开源项目与Agent十年论、Nof1让7个AI模型用真金白银炒币的社会实验,以及AI生成内容超越人类产出的深度观察。
产品体验深度解析腾讯音乐开源的Cube Studio云原生AI平台,涵盖Notebook开发、Pipeline编排、分布式训练、大模型微调、推理部署及国产化适配等核心能力,助力企业快速构建MLOps全流程基础设施。
产品体验深度解析腾讯开源AI平台Cube Studio,覆盖分布式训练、大模型微调、推理部署、VGPU虚拟化及国产化适配等核心功能,帮助企业构建MLOps全流程一站式AI基础设施。
产品体验Unsloth是GitHub 63K+星标的开源大模型微调工具,支持Gemma 4、Qwen 3、DeepSeek等主流模型,通过LoRA/QLoRA技术将训练速度提升2-5倍,显存降低80%,提供Web UI界面让本地微调大模型变得简单高效。
产品体验Unsloth 是 GitHub 63000+ Star 的开源大模型训练工具,支持 Gemma 4、Qwen3、DeepSeek 等主流模型的本地微调,提供 Web UI 界面、显存优化和 2-5 倍训练加速,让消费级 GPU 也能跑通模型微调全流程。
产品体验深度解析腾讯音乐开源的Cube Studio云原生AI平台,涵盖分布式训练、DeepSeek大模型微调、vLLM推理部署、VGPU算力管理等核心功能,支持华为昇腾国产化生态,助力企业构建私有AI基础设施。