VoxCPM:开源的多语言语音合成与声音克隆模型
介绍 OpenBMB/VoxCPM:一个基于连续语音表征的开源多语言 TTS 与声音克隆系统,支持音色设计、可控克隆、48kHz 高质量输出和服务化部署。
技术文章、AI 工具观察和开源项目实践
介绍 OpenBMB/VoxCPM:一个基于连续语音表征的开源多语言 TTS 与声音克隆系统,支持音色设计、可控克隆、48kHz 高质量输出和服务化部署。
介绍 Headroom:一个面向 AI Agent 和 LLM 应用的上下文压缩层,用来在工具输出、日志、文件和 RAG 片段进入模型前减少 token 消耗。
介绍 ERPNext:一个基于 Frappe Framework 构建的开源 ERP 系统,覆盖财务、库存、销售、采购、制造、项目、人事和客户服务等企业核心流程。
html-video 是 Open Design 团队推出的开源项目,它用 Coding Agent 理解内容和组织故事板,用 HTML/CSS 表达画面,再通过 Chromium 与 ffmpeg 在本地渲染成真实 MP4。
html-ppt-skill 是一套面向 AI Agent 的 HTML PPT 生成技能包,用纯静态 HTML/CSS/JS 快速产出带主题、布局、动效和演讲者模式的专业演示文稿。

