#CUDA

共 119 篇相关文章

教程攻略

2026年5月28日·7 分钟

Ollama本地部署大模型完全指南：断网也能用的AI

详解Ollama本地部署开源大模型的完整流程，涵盖安装配置、模型选择、显存要求及实际效果对比。支持Llama 3、通义千问等主流模型，零成本、断网可用，轻松打造私有AI工作站。

阅读全文 →

DLSS 4.5深度集成UE5与多语言AI角色：NVIDIA RTX游戏开发重大更新

产品体验

2026年5月28日·7 分钟

DLSS 4.5深度集成UE5与多语言AI角色：NVIDIA RTX游戏开发重大更新

NVIDIA发布RTX技术重大更新，DLSS 4.5深度集成虚幻引擎5带来帧生成性能飞跃，多语言AI角色支持动态对话与实时语音合成，全面革新游戏开发流程与玩家交互体验。

阅读全文 →

产品体验

2026年5月27日·4 分钟

NVIDIA CompileIQ：自动调优编译器选项，榨干GPU内核性能

深入解析NVIDIA CompileIQ自动调优工具，通过智能搜索编译器选项组合，为CUDA内核找到最优编译参数。覆盖技术原理、工作流程、AI训练与科学计算等应用场景，助力GPU性能工程师大幅提升内核执行效率。

阅读全文 →

教程攻略

2026年5月27日·4 分钟

NVIDIA CUDA Tile：基于瓦片的GPU编程新范式详解

深入解析NVIDIA最新发布的CUDA Tile编程模型，了解其基于瓦片的GPU内核开发方式如何融合C++生态、优化数据局部性并加速Tensor Core计算，适用于HPC、深度学习和AI推理等场景。

阅读全文 →

科技前沿

2026年5月26日·5 分钟

Anthropic算力扩张解读：更多芯片如何让Claude更强更快

Anthropic宣布大规模扩充算力，发布"More chips, more Claude"动态。本文解读芯片扩张对Claude用户体验、服务容量、响应速度及下一代模型的实际影响，分析AI算力军备竞赛最新格局。

阅读全文 →

行业洞察

2026年5月25日·5 分钟

SpaceX投资550亿美元在德州建AI芯片工厂Terafab

SpaceX计划在德克萨斯州奥斯汀投资550亿美元建设名为Terafab的AI芯片制造工厂，这是Elon Musk构建AI垂直整合帝国的关键一步，将成为美国史上最大单一芯片工厂投资之一。

阅读全文 →

行业洞察

2026年5月25日·6 分钟

C++结合AI全栈培训课程深度分析：2026年程序员转型路径

深度分析C++与AI全栈培训课程的设计逻辑，涵盖CUDA、YOLO、RAG等技术栈融合方案，解读利益绑定服务机制、面试复盘体系及定价策略，为C++开发者转型AI方向提供参考。

阅读全文 →

教程攻略

2026年5月24日·5 分钟

Ollama本地部署大模型教程：安装配置到API调用全流程

详解Ollama本地部署开源大模型的完整流程，涵盖安装配置、模型选择与量化策略、Python代码调用API、性能优化等实战技巧，帮你快速在本地运行Qwen、Llama等大模型。

阅读全文 →

DeepSeek V4深度解析：混合注意力+流形约束+MOM优化器三大创新全解读

产品体验

2026年5月23日·5 分钟

DeepSeek V4深度解析：混合注意力+流形约束+MOM优化器三大创新全解读

深度解析DeepSeek V4三大底层技术创新：混合注意力架构实现百万Token上下文、流形约束超连接稳定极深网络训练、MOM优化器加速收敛。V4 Pro性能对标Claude Opus 4.6，成本仅为其七分之一，附编程实测与部署方案。

阅读全文 →

AI周报：GPT 6代号Spud曝光、Claude Conway代理、DeepSeek V4转向华为芯片

科技前沿

2026年5月23日·5 分钟

AI周报：GPT 6代号Spud曝光、Claude Conway代理、DeepSeek V4转向华为芯片

本周AI重磅动态汇总：OpenAI下一代基座模型Spud（GPT 6）2026年春季发布，Anthropic开发长驻型AI代理Conway，Cursor 3为AI代理重构IDE，DeepSeek V4首次在华为芯片原生训练，通义千问3.6与Gemma 4开源模型双雄并立。

阅读全文 →

科技前沿

2026年5月22日·4 分钟

黄仁勋承认华为芯片很强大：英伟达已让出中国AI芯片市场

英伟达CEO黄仁勋公开表示华为"非常强大"，承认英伟达已撤离中国AI芯片市场。本文深度解析黄仁勋罕见表态背后的产业逻辑，以及中国本土AI芯片生态崛起对开发者的影响。

阅读全文 →

教程攻略

2026年5月22日·7 分钟

FastEmbed教程：轻量级本地向量嵌入库安装与实战指南

详解FastEmbed轻量级Python嵌入库的安装配置、文本与图像嵌入用法，以及与Qdrant向量数据库的无缝集成，帮助开发者在无GPU环境下快速构建本地AI应用。

阅读全文 →

教程攻略

2026年5月22日·8 分钟

ONNX模型部署实战：从PyTorch导出到跨框架推理完整指南

详解ONNX神经网络交换格式的核心原理与实战应用。涵盖PyTorch和TensorFlow模型导出ONNX、ONNX Runtime推理、MNIST分类器部署、HuggingFace模型下载等完整流程，附可运行代码示例。

阅读全文 →

教程攻略

2026年5月22日·7 分钟

Python OpenCV入门教程：图片读取与显示完整指南

详解Python中OpenCV的安装与使用，涵盖imread读取图片、imshow显示图片、waitKey等待键盘输入及destroyAllWindows释放内存等核心操作，附完整示例代码与常见问题解决方案。

阅读全文 →

教程攻略

2026年5月22日·6 分钟

Docker Model Runner使用教程：一条命令本地运行AI模型

详解Docker Model Runner的安装配置与实战用法，通过Docker Compose集成本地AI模型，兼容OpenAI API接口，实现零配置本地部署LLM大模型，附完整聊天应用开发示例。

阅读全文 →

教程攻略

2026年5月21日·6 分钟

Hermes + Qwen3.6 本地部署教程：零成本搭建私有AI Agent

详细教程教你用Hermes Agent搭配Qwen3.6开源大模型，在本地零成本部署私有AI助手。涵盖WSL环境配置、模型下载启动、Telegram机器人对接及开机自启设置，实现无限Token、数据私有的AI Agent体验。

阅读全文 →

教程攻略

2026年5月21日·5 分钟

vLLM与SGLang本地部署教程：性能提升3-8倍的实战指南

详解vLLM和SGLang本地部署全流程，对比LM Studio性能差距，通过Docker+AI助手三步完成部署。涵盖SGLang与vLLM选型建议、5090显存优化、Qwen3模型推荐及Cherry Studio接入方法。

阅读全文 →

教程攻略

2026年5月21日·6 分钟

MoS-TTS-Nano部署教程：0.1B超轻量TTS模型CPU即可运行

经实战验证的MoS-TTS-Nano本地部署教程，0.1B参数超轻量TTS语音合成模型无需GPU，四核CPU即可流畅运行。涵盵Conda环境配置、pynini安装踩坑解决、模型下载及Gradio WebUI启动全流程。

阅读全文 →

教程攻略

2026年5月19日·6 分钟

物理AI机器人全栈开发入门：从硬件到ROS2完整技术栈指南

零基础入门物理AI机器人开发，系统梳理从GPU硬件、Linux系统、Python编程、深度学习、计算机视觉到ROS2的完整技术栈，附清晰学习路线图，助你快速建立机器人全栈开发知识体系。

阅读全文 →

深度解读

2026年5月19日·9 分钟

XANI：GPU加速X射线纳米成像如何革新XFEL数据分析

深入解析XANI项目如何利用NVIDIA GPU加速X射线自由电子激光(XFEL)数据分析，将纳米级成像处理从数天压缩至数小时，推动聚变材料与半导体研究突破。了解GPU并行计算在大科学装置中的前沿应用。

阅读全文 →