#Scaling Laws

共 7 篇相关文章

通过贪吃蛇对战、强化学习训练、太阳系模拟器、足球游戏四大任务，实测对比O3、Gemini 2.5 Pro、Claude 3.7等AI模型的编程能力，揭示各模型在不同复杂度任务中的真实表现。

互联网数据即将见顶，合成数据成为AI模型训练的必然选择。本文深入分析合成数据的模型崩溃风险、三条安全使用铁律，以及从资源依赖到数据工程能力竞争的范式转变。

Jeff Dean回顾Google翻译20年三次技术跃迁：2006年万亿token语言模型验证Scaling Law，2016年Seq2Seq+TPU实现神经网络翻译，如今引入Gemini大模型。一部浓缩的现代AI发展史。

IBM发布Granite 4.1系列Apache 2.0开源大模型，Unsloth提供21种GGUF量化变体。Simon Willison用鹈鹕骑自行车SVG提示词逐一测试，揭示3B模型量化精度与输出质量的真实关系。

英国AI安全研究所(AISI)发布GPT-5.5网络安全能力评估报告，结果显示其漏洞发现能力与Claude Mythos相当，但因已向公众开放使用，引发AI安全治理新挑战。本文深入解读评估发现与行业影响。

英国AI安全研究所(AISI)发布GPT-5.5网络安全能力评估报告，结果显示其漏洞发现能力与Claude Mythos相当，但GPT-5.5已面向公众开放。本文解读评估结果及其对AI安全行业的深远影响。

红杉AI Ascent 2026上，OpenAI联合创始人Greg Brockman深度解读算力军备竞赛、Codex编码革命、AGI进展80%的判断，以及AI时代创业者和组织的生存策略。