#参数

共 1667 篇相关文章

深度解读MYLLM开源项目，一个用Qwen2.5-0.5B小模型覆盖LLM训练、LoRA微调、SFT、知识蒸馏、RLHF、多模态、Agent全栈技术的个人作品集，适合AI入门者参考学习。

深度解读GitHub热门项目awesome-LLM-resources，一个8200+ Star的LLM资料总结仓库，覆盖多模态生成、Agent、辅助编程、o1模型、MCP、小语言模型等核心方向。

OpenAI GPT-5.5模型集体输出「哥布林」词汇，官方技术博客揭示强化学习奖励信号泛化的根本原因。

星野猫箱关停后，AI角色扮演难民何去何从？本文深度解析AI聚合平台的功能、模型对比及使用体验，涵盖DeepSeek、ChatGPT、Grok等主流大模型实测。

深度解析 Simon Willison 的 LLM Python 库 0.32a0 alpha 版本，涵盖消息序列、流式类型化部件、工具调用等核心变更，以及向后兼容重构的设计哲学。

深度解析Unsloth开源项目：通过Web UI实现本地大模型微调与推理，支持Gemma 4、Qwen3.6、DeepSeek等主流模型，显存降低70%，速度提升5倍。

Ollama是GitHub上17万星标的开源本地大模型部署工具，一行命令即可运行DeepSeek、Qwen、Kimi-K2.5、GLM-5等主流模型。本文详解Ollama的核心优势、支持模型及本地推理的深层意义。