#Scaling Law

共 37 篇相关文章

深度解读

2026年5月15日·8 分钟

Google翻译20年技术演进：从万亿token到TPU再到Gemini

Jeff Dean回顾Google翻译20年三次技术跃迁：2006年万亿token语言模型验证Scaling Law，2016年Seq2Seq+TPU实现神经网络翻译，如今引入Gemini大模型。一部浓缩的现代AI发展史。

阅读全文 →

深度解读

2026年5月15日·8 分钟

阿里QwQ-32B开源：32B参数如何媲美671B的DeepSeek R1

阿里开源推理模型QwQ-32B仅用32B参数，在多项基准测试中媲美甚至超越DeepSeek R1满血版（671B）。本文深度解析其两阶段强化学习训练策略、性能对比数据，以及强化学习带来的能力涌现现象，揭示小参数模型以小博大的核心秘密。

阅读全文 →

Claude Haiku 4.5深度评测：成本降三分之一，编程性能比肩Sonnet 4

产品体验

2026年5月15日·7 分钟

Claude Haiku 4.5深度评测：成本降三分之一，编程性能比肩Sonnet 4

Anthropic发布Claude Haiku 4.5模型，编程能力比肩Sonnet 4，API成本仅为三分之一，速度翻倍。实测28美分构建浏览器版macOS，多Agent协作成本大幅降低，重新定义小型AI模型能力边界。

阅读全文 →

IBM Think 2025深度解读：推理模型幻觉加剧与OpenAI收购Windsurf

科技前沿

2026年5月15日·10 分钟

IBM Think 2025深度解读：推理模型幻觉加剧与OpenAI收购Windsurf

深度解析IBM Think 2025大会发布的生成式计算与Granite 4模型、推理模型幻觉率上升的根本原因，以及OpenAI 30亿美元收购Windsurf背后的垂直整合战略，洞察2025年AI产业关键转折。

阅读全文 →

深度解读

2026年5月13日·8 分钟

LLM推理能力演进：从思维链到DeepSeek-R1全解析

系统梳理LLM推理能力的技术演进路线，涵盖Chain-of-Thought思维链、Tree-of-Thought、OpenAI o1与DeepSeek-R1推理模型的核心原理与差异，解读开源项目Awesome-LLM-Reasoning的研究趋势洞察。

阅读全文 →

awesome-LLM-resources：GitHub 8200星LLM学习资源库全面解析

产品体验

2026年5月13日·7 分钟

awesome-LLM-resources：GitHub 8200星LLM学习资源库全面解析

深度解析GitHub万星项目awesome-LLM-resources，涵盖LLM多模态生成、Agent智能体、模型训练推理、MCP协议等十大核心模块，为AI从业者提供一站式大语言模型学习导航。

阅读全文 →

IBM Granite 4.1开源模型：21种GGUF量化版本SVG生成实测对比

产品体验

2026年5月13日·6 分钟

IBM Granite 4.1开源模型：21种GGUF量化版本SVG生成实测对比

IBM发布Granite 4.1系列Apache 2.0开源大模型，Unsloth提供21种GGUF量化变体。Simon Willison用鹈鹕骑自行车SVG提示词逐一测试，揭示3B模型量化精度与输出质量的真实关系。

阅读全文 →

awesome-LLM-resources：GitHub 8K Star最全大语言模型学习资源库解析

产品体验

2026年5月13日·8 分钟

awesome-LLM-resources：GitHub 8K Star最全大语言模型学习资源库解析

深度解析GitHub万星项目awesome-LLM-resources，涵盖多模态、AI Agent、MCP协议、模型训练推理、辅助编程等LLM核心方向，为AI从业者提供一站式学习资源导航与使用指南。

阅读全文 →

产品体验

2026年5月10日·7 分钟

GSD-2开源项目详解：元提示+上下文工程如何让AI代理持久自主工作

深入解析GitHub热门项目GSD-2的三大核心技术：元提示、上下文工程和规范驱动开发，了解它如何解决AI代理长时间工作偏离目标的难题，以及对AI开发工具的行业影响。

阅读全文 →

科技前沿

2026年5月8日·8 分钟

英国AISI评估报告：GPT-5.5网络安全能力与公开可用性引发治理关注

英国AI安全研究所(AISI)发布GPT-5.5网络安全能力评估报告，结果显示其漏洞发现能力与Claude Mythos相当，但因已向公众开放使用，引发AI安全治理新挑战。本文深入解读评估发现与行业影响。

阅读全文 →

英国AI安全研究所评估GPT-5.5：网络安全能力比肩Claude Mythos

前沿研究

2026年5月7日·6 分钟

英国AI安全研究所评估GPT-5.5：网络安全能力比肩Claude Mythos

英国AI安全研究所(AISI)发布GPT-5.5网络安全能力评估报告，结果显示其漏洞发现能力与Claude Mythos相当，但GPT-5.5已面向公众开放。本文解读评估结果及其对AI安全行业的深远影响。

阅读全文 →

教程攻略

2026年5月7日·8 分钟

MiniMind-V：2小时从零训练65M参数视觉多模态大模型完整教程

MiniMind-V是一个开源轻量化视觉多模态大模型项目，仅需2小时即可从零训练65M参数VLM模型。本文详解其技术架构、训练流程及教育价值，适合AI初学者和研究者快速上手实践。

阅读全文 →

awesome-LLM-resources：GitHub 8000+ Star的LLM资源大全深度解析

产品体验

2026年5月7日·9 分钟

awesome-LLM-resources：GitHub 8000+ Star的LLM资源大全深度解析

深度解析GitHub万星项目awesome-LLM-resources，涵盖AI Agent、模型训练、MCP协议、多模态生成等LLM十大核心方向，为研究人员和开发者提供最全面的大语言模型资源索引指南。

阅读全文 →

awesome-LLM-resources：GitHub 8K Star最全大语言模型资源库解析

产品体验

2026年5月7日·13 分钟

awesome-LLM-resources：GitHub 8K Star最全大语言模型资源库解析

深度解析GitHub热门项目awesome-LLM-resources，涵盖大语言模型训练推理、Agent、MCP、多模态、小语言模型、o1推理等十余个核心方向，8200+ Star的中文LLM一站式资源导航。

阅读全文 →

教程攻略

2026年5月7日·9 分钟

GitHub 8K Star：最全LLM资源宝库深度解析

深度解析GitHub上8200+ Star的awesome-LLM-resources项目，涵盖多模态模型、AI Agent、MCP协议、模型训练推理、辅助编程等LLM核心技术板块，助你系统学习大语言模型前沿知识。

阅读全文 →

产品体验

2026年5月6日·13 分钟

Unsloth：本地微调大模型速度提升5倍的开源神器

Unsloth 是 GitHub 63000+ Star 的开源大模型训练工具，支持 Gemma 4、Qwen3、DeepSeek 等主流模型的本地微调，提供 Web UI 界面、显存优化和 2-5 倍训练加速，让消费级 GPU 也能跑通模型微调全流程。

阅读全文 →

观点碰撞

2026年5月4日·8 分钟

OpenAI格雷格·布罗克曼谈算力、Codex与AGI竞赛：我们已走到80%

红杉AI Ascent 2026上，OpenAI联合创始人Greg Brockman深度解读算力军备竞赛、Codex编码革命、AGI进展80%的判断，以及AI时代创业者和组织的生存策略。

阅读全文 →