#量化模型

共 61 篇相关文章

2026年6月5日·7 分钟

AI基准测试：当前最被低估的技术创业机会

AI基准测试正成为巨大的创业机会。传统评测被刷爆、供需严重失衡，谁能构建高质量公共AI基准测试，谁就掌握行业话语权。本文解析为何AI评测基础设施是高回报的差异化路径。

阅读全文 →

联想ThinkBook 16+ R7-H255评测：4799元AI编程办公本值得买吗

产品体验

2026年6月3日·2 分钟

联想ThinkBook 16+ R7-H255评测：4799元AI编程办公本值得买吗

联想ThinkBook 16+搭载AMD R7-H255处理器，售价4799元，定位AI编程与商务办公。本文从处理器性能、价格定位、适用场景等方面分析这款16英寸高性能笔记本的实际表现与购买建议。

阅读全文 →

教程攻略

2026年6月3日·7 分钟

Ollama入门指南：本地部署开源大模型的最佳工具

详解Ollama本地大模型管理工具的核心功能与特点，包括免费开源、跨平台支持、智能GPU/CPU调度、API集成等能力，帮助你零成本在本地运行DeepSeek等开源大模型。

阅读全文 →

教程攻略

2026年6月3日·7 分钟

OpenClaw本地部署教程：10分钟接入微信飞书钉钉

详解OpenClaw（小龙虾）本地部署全流程，涵盖Windows安装、云部署、微信/飞书/钉钉多平台接入及自定义Skills编写，零基础用户10分钟即可完成部署上手。

阅读全文 →

教程攻略

2026年6月3日·5 分钟

AI漫剧制作全流程：从脚本到成片的系统方法论

详解AI漫剧制作完整工作流，涵盖语言大模型写脚本、即梦等平台生成画面、后期剪辑成片三大环节，帮助零基础创作者掌握可复用的系统方法论，告别教程翻车。

阅读全文 →

教程攻略

2026年6月3日·7 分钟

World Monitor开源情报工具：GitHub 5万星全球实时监测神器

详解GitHub 5万Star开源项目World Monitor（WM），涵盖交互式世界地图、全球广播聚合、AI战略风险评估、实时情报金融数据等核心功能，附5种部署方式完整教程。

阅读全文 →

产品体验

2026年6月3日·9 分钟

Google Gemma 4实测：手机离线运行+Ollama部署教程

实测Google Gemma 4开源模型在三台手机上的离线运行表现，详解Dense与MOE架构区别，附Ollama + Claude Code完整部署教程。从1B到31B四款模型覆盖手机到工作站全场景，4GB显存即可运行。

阅读全文 →

产品体验

2026年6月3日·8 分钟

WhichLLM：一键检测你的电脑最适合跑哪个本地大模型

WhichLLM 是一款开源工具，能自动检测电脑硬件配置，结合权威评测数据推荐最适合本地运行的大语言模型。支持模拟任意显卡配置、过滤虚假评测、一键下载开聊，帮你告别选模型的纠结。

阅读全文 →

教程攻略

2026年6月2日·10 分钟

llama.cpp MTP加速部署指南：配置步骤与性能实测

详解llama.cpp如何启用MTP多Token预测加速技术，涵盖CUDA环境配置、桌面端设置、模型选择及实测性能数据，Qwen3 27B实测近60 Token/s。

阅读全文 →

教程攻略

2026年6月2日·11 分钟

前端AI全栈开发实战：PNPM MonoRepo架构搭建多模态应用

详解前端AI全栈开发的工程化实践，从PNPM MonoRepo架构设计、TurboRepo构建优化到LangChain多模态应用完整链路，涵盖子包规划、AI引擎封装、Ollama模型调用等核心环节，助力前端开发者快速切入AI全栈赛道。

阅读全文 →

教程攻略

2026年6月2日·7 分钟

AnythingLLM安装配置教程：本地知识库搭建与API调用指南

详解AnythingLLM本地知识库的安装避坑、Ollama模型配置、文档向量化、知识库召回率优化及API调用方法，帮助你快速搭建私有智能问答系统。

阅读全文 →

行业洞察

2026年5月30日·5 分钟

SGLang进军金融业：AI推理基础设施如何重塑华尔街

SGLang联合Crusoe AI、Cloudflare等举办金融AI推理活动，探讨LLM推理框架在交易、风控、合规等场景的落地应用，解析AI推理基础设施垂直化趋势及金融行业部署前景。

阅读全文 →

教程攻略

2026年5月29日·10 分钟

CrewAI+FastAPI搭建多Agent协作应用实战指南

详解如何使用CrewAI框架搭建多Agent协作系统，结合FastAPI封装为API服务。涵盖Agent、Task、Crew核心概念解析，支持GPT、通义千问、Ollama三种大模型接入方案，附完整代码示例与模型效果对比。

阅读全文 →

Claude Agent SDK+LiteLLM+本地大模型：零成本搭建智能体平台

教程攻略

2026年5月28日·9 分钟

Claude Agent SDK+LiteLLM+本地大模型：零成本搭建智能体平台

详解如何通过LiteLLM Proxy将Claude Agent SDK的API请求重定向到本地大模型，在保留完整Agent框架能力的同时将推理成本降为零。含架构设计、实战演示与企业级部署方案。

阅读全文 →

教程攻略

2026年5月28日·8 分钟

RAG技术全链路解析：核心原理、企业落地与学习路径

深度解析RAG（检索增强生成）技术的核心原理、三大价值、企业落地案例与常见困境，并提供从基础到进阶的系统学习路线，涵盖向量数据库、检索策略优化、知识图谱融合等关键技术栈。

阅读全文 →

教程攻略

2026年5月26日·6 分钟

Bolt.diy本地部署教程：免费开源的AI全栈开发工具

Bolt.diy是Bolt.new的开源替代方案，支持自由接入OpenAI、Claude等大模型，本地部署零订阅费。本文详解安装配置流程、模型选择方案及适用场景，助你低成本实现AI全栈开发。

阅读全文 →

教程攻略

2026年5月22日·4 分钟

前端工程师如何系统构建AI Agent架构能力

前端工程师如何从调接口走向系统化的AI Agent架构？本文从前端基本盘、服务端边界、RAG知识库、LangChain.js/LangGraph.js编排到多Agent协作，梳理完整的AI应用落地路径与各阶段学习重点。

阅读全文 →

教程攻略

2026年5月22日·8 分钟

ONNX模型部署实战：从PyTorch导出到跨框架推理完整指南

详解ONNX神经网络交换格式的核心原理与实战应用。涵盖PyTorch和TensorFlow模型导出ONNX、ONNX Runtime推理、MNIST分类器部署、HuggingFace模型下载等完整流程，附可运行代码示例。

阅读全文 →

教程攻略

2026年5月22日·6 分钟

Docker Model Runner使用教程：一条命令本地运行AI模型

详解Docker Model Runner的安装配置与实战用法，通过Docker Compose集成本地AI模型，兼容OpenAI API接口，实现零配置本地部署LLM大模型，附完整聊天应用开发示例。

阅读全文 →

教程攻略

2026年5月21日·6 分钟

本地部署大模型怎么判断显存爆了？一文看懂显存监控方法

本地部署大模型时如何判断显存是否爆满？本文详解专用显存与共享GPU内存的区别，教你通过任务管理器快速判断显存溢出，并提供模型量化、上下文长度控制等避免爆显存的实用建议。

阅读全文 →