共 33 篇相关文章
科技前沿开源AI语音生成项目Dia上线一天GitHub星标破5000,由两名本科生自学3个月打造。1.6B参数实现近乎实时的双人对话生成,效果媲美谷歌NotebookLM,支持笑声、咳嗽等非语言细节模拟。
产品体验基于Qwen 3.5 Omni全模态模型和ESP32-S3的开源AI桌宠小猫项目,支持情感语音交互、视觉感知、手势互动和一日记录复盘功能。附完整复刻教程,含硬件清单、3D打印模型和代码烧录指南。
科技前沿阿里开源Qwen3.6 35B模型,256专家MoE架构仅需3B激活参数,SWE Bench成绩逼近Claude Opus。xAI发布Voice Cloning API支持28种语言,NVIDIA开源OpenShell安全沙箱,Sam Altman表态模型智力优先。
产品体验深入解析小智AI语音助手Flutter客户端的技术架构与核心功能,涵盖实时语音交互、Flutter跨平台开发方案、前后端分离架构设计,以及与xiaozhi-server的协作模式,助力开发者快速构建AI语音对话应用。
产品体验深入解析xiaozhi-esp32-server-golang开源项目,用Go语言重写小智ESP32后端服务,支持WebSocket/MQTT双协议、声纹识别、MCP远程调用等功能,为AI硬件提供高性能后端方案。
教程攻略详解Google AI Studio核心功能:无水印AI图像生成、多角色文本转语音、零代码构建AI应用。涵盖Playground高级设置、Build应用构建、Firebase集成等实用技巧,附操作步骤与配额策略。
教程攻略详解MCP协议(模型上下文协议)的核心概念、函数定义方法及实战应用。通过ESP32+Mixly图形化编程平台,演示如何用MCP让AI大模型理解语义并控制灯光等硬件设备,附完整参数配置说明。
教程攻略详解小智AI通过MCP协议与STM32双机通信实现智能家居语音控制的完整方案,涵盖步进电机精准控制、灯光风扇加湿器开关控制,以及MCP协议在嵌入式硬件领域的落地实践。
科技前沿谷歌以24亿美元截胡OpenAI成功收购AI编程公司Windsurf,Meta同步收购语音AI公司PlayAI。科技巨头AI并购潮背后,人才争夺、垂直整合与应用生态竞争正在重塑全球AI产业格局。
产品体验百聆(bailing)是一款基于ASR+LLM+TTS架构的开源语音助手,集成DeepSeek R1大模型,端到端延迟仅800ms,支持打断对话,可在Mac等低配设备流畅运行,助你打造私有化个人AI语音助手。
深度解读深入分析WebRTC在AI语音交互场景中的设计缺陷:丢包优先策略导致用户prompt残缺、LLM响应质量下降。探讨MoQ等替代协议如何更好地平衡数据完整性与低延迟需求。
产品体验深度解析UnrealGenAISupport开源插件,集成GPT-5、Claude、Gemini等数十种AI模型,内置MCP服务器支持UE5编辑器操控,实现智能NPC对话、3D资产生成、AI Agent工作流,是虚幻引擎5接入生成式AI的首选方案。