共 94 篇相关文章
产品体验独立开发者自研AI IDE WaLiCode发布v0.2.0版本,新增多工程跨项目对话、任务拆解执行模式、Ollama本地模型接入等功能,解决主流AI IDE单工程对话的痛点,为开发者提供更灵活可控的AI编程体验。
产品体验使用4张3080Ti 16G魔改显卡本地部署千问3.6 27B FP8模型,配合OpenCode完成系统管理工具开发的完整实测。涵盖硬件配置、推理速度、上下文管理经验及开发效率对比。
教程攻略系统拆解大模型命名规则,解释32B参数量、AWQ/GGUF量化格式的含义,提供4-bit量化显存估算公式与速查表,涵盖MOE模型显存陷阱、IMatrix量化推荐及按显存档位的模型选择建议。
教程攻略系统梳理大模型学习的七大核心板块,涵盖环境搭建、提示词工程、RAG检索增强生成、Agent智能体、开发框架、模型微调部署及实战项目,帮助开发者快速构建完整的大模型技能体系。
教程攻略详解Ollama本地部署开源大模型的完整流程,涵盖安装配置、模型选择、显存要求及实际效果对比。支持Llama 3、通义千问等主流模型,零成本、断网可用,轻松打造私有AI工作站。
教程攻略本地部署大模型时如何判断显存是否爆满?本文详解专用显存与共享GPU内存的区别,教你通过任务管理器快速判断显存溢出,并提供模型量化、上下文长度控制等避免爆显存的实用建议。
行业洞察企业如何选择开源大模型?本文从模型能力、硬件需求、业务场景三个维度,深度对比Llama 3.1、Qwen 2.5、DeepSeek、Mistral等主流开源模型,提供选型决策框架与实践建议。
深度解读通过开源工具直观体验LLM不同Token生成速度(5-800 TPS)的实际效果,帮助开发者理性选择模型、优化推理性能,告别对TPS数字的盲目追求。
产品体验实测星火WinShape插件实现Windsurf账号自动无感切换,批量管理账号持续使用Claude Opus模型。详细拆解使用流程、核心功能与风险分析,并推荐更稳妥的合规替代方案。
教程攻略详解如何实现Token自由,涵盖模型选择、中转API、Prompt优化、免费额度利用等5大策略,帮助开发者大幅降低GPT和Codex的API调用成本,轻松节省Token开支。
教程攻略手把手教你用DeepSeek+RAGFlow+Ollama本地部署个人AI知识库。涵盖RAG原理解析、Ollama安装、Docker部署RAGFlow、知识库创建与调优全流程,数据完全私有,零基础可上手。
教程攻略深入解析NVIDIA Model Optimizer训练后量化(PTQ)工作流,涵盖INT8/INT4量化原理、校准方法、RTX GPU优化策略及大语言模型量化部署最佳实践,助你在消费级显卡上高效运行大模型。
深度解读深入解析MARVIS项目如何将大语言模型Agent部署到太空飞行器,涵盖Agent架构设计、边缘硬件Token性能实测、专家评估结果及太空通用智能基准测试规划,探索从POC到深空自主探索的完整技术路线。
产品体验深度解析AnythingLLM开源项目,一款隐私优先、零配置的本地AI生产力平台。支持RAG文档对话、多模型接入、知识库管理和AI Agent,GitHub近6万星标,适合企业和个人本地部署使用。
产品体验深度解析GitHub近4万Star的开源AI客户端Chatbox,支持GPT-4、Claude、Gemini等多模型一键切换,数据本地存储保护隐私,跨平台桌面应用。详解核心功能、适用场景及与Jan、TypingMind等同类产品对比。
教程攻略OpenAI正式开源GPT-OSS系列模型(20B/120B),采用MOE架构+FP4混合精度,单卡4090即可运行O3级推理模型。本文详解核心技术、性能评测及Ollama/vLLM等四种本地部署方案。
行业洞察深度剖析AI生成测试用例的5大常见坑:需求拆分不足、图文识别盲区、覆盖遗漏等,并给出Agent+Skill智能体平台的完整解决方案,实现从需求分析到自动执行的测试全流程闭环,助力测试从业者掌握2026年核心竞争力。
教程攻略手把手教你用Codex搭配Ollama在本地部署免费AI编程助手,涵盖硬件检测、Ollama安装、Gemma/Qwen模型下载与接入配置全流程,轻松实现隐私安全的本地AI编程工作流。
教程攻略深度解析Google AI Studio 2.0全部功能:免费使用Gemini 3.1 Pro百万token上下文、VO3视频生成、Nano Banana图像创作、Vibe Coding零代码构建应用,附变现思路与实战技巧。
教程攻略详细教程:通过Ollama本地部署千问3 Coder大模型,配合OpenCode开源编程工具,实现零成本AI编程。涵盖环境搭建、代码生成、自动调试全流程,附硬件配置建议。