html-video:用 HTML、CSS 和 Coding Agent 在本地生成真实 MP4
html-video 是 Open Design 团队推出的开源项目,它用 Coding Agent 理解内容和组织故事板,用 HTML/CSS 表达画面,再通过 Chromium 与 ffmpeg 在本地渲染成真实 MP4。
文章
html-video 是 Open Design 团队推出的开源项目,它用 Coding Agent 理解内容和组织故事板,用 HTML/CSS 表达画面,再通过 Chromium 与 ffmpeg 在本地渲染成真实 MP4。
html-ppt-skill 是一套面向 AI Agent 的 HTML PPT 生成技能包,用纯静态 HTML/CSS/JS 快速产出带主题、布局、动效和演讲者模式的专业演示文稿。
OpenViking、Mirage、SkillOpt 这类项目说明,AI Agent 的竞争点正在从模型调用,转向上下文、文件系统和可优化技能这些基础设施。
GitHub Copilot 转向 usage-based billing、OpenRouter 推出 Guardrails、AgentBudget 这类项目出现,说明 AI 工具正在从订阅制体验进入按量计费和预算治理阶段。
从 X 上流传的 Codex 优化网速案例和爱范儿实测说起:Codex 可能帮你发现 DNS、Wi-Fi、代理、后台进程和系统网络配置问题,但它不是一键突破带宽上限的加速器。
介绍 DigitalPlat FreeDomain:一个提供免费域名注册和 DNS 接入的平台,适合个人项目、开源项目、学生作品集和早期产品 Demo。
介绍 earendil-works/pi:一个以终端为核心、强调可扩展与可自定义的 AI coding agent harness,覆盖 CLI、Agent runtime、统一模型 API、TUI 组件和包机制。
从 GitHub Trending 上同时出现的 Understand-Anything、Superpowers、ECC、knowledge-work-plugins、stop-slop、taste-skill 等项目,看 AI Agent 能力如何从提示词转向可安装、可复用、可审计的工作方法。
AI Agent 的安全日志不能只记录 API 调用成功或失败,还要记录用户目标、Agent 计划、工具调用、权限判断、人工确认和执行结果之间的完整链路。
Codex 的价值正在从生成代码,转向承接长期任务:用 durable threads、目标、工具验证、自动化和项目规则,把一个任务持续推进到可检查的结果。
HTML Anything 是一个本地优先的 Agentic HTML 编辑器,把 Markdown、表格、草稿和数据交给本机已登录的 AI coding agent,生成可以直接发布的单文件 HTML 或 PNG。
Marketing Skills for AI Agents 是一套面向 AI 编程代理的营销技能包,让 Claude Code、OpenAI Codex、Cursor、Windsurf 等 Agent 在处理 SEO、转化率优化、文案、广告、分析和增长任务时,有更专业的工作流与判断标准。
AI Agent 的长期记忆不应该是聊天记录垃圾桶,而应该是一层可验证、可过期、能改变未来行为的工作上下文。本文整理 Agent 应该记住什么、重新验证什么、以及绝对不该存什么。
Codex Chrome 插件是 Codex App 的浏览器能力扩展,适合处理必须依赖 Chrome 登录态、浏览器上下文或真实网页操作的任务。
Warp 是从终端演进而来的 AI 原生开发环境,把命令行、编码 Agent、Git Diff、代码审查和提交工作流整合在同一个界面里。
DeepSeek TUI 是面向 DeepSeek V4 的终端原生编程 Agent,支持 100 万 token 上下文、Auto mode、Plan/Agent/YOLO 模式、side-git 回滚、LSP 诊断、MCP、RLM 和成本追踪。
一篇面向 Codex CLI 用户的指令速查:覆盖安装登录、交互式斜杠指令、codex exec、代码审查、会话恢复、权限沙箱、配置、MCP 与日常工作流。
面向零基础用户的 OpenAI Codex 入门指南:认识 Codex App、IDE 扩展、CLI、Web / Cloud,理解权限、沙盒、Git checkpoint、AGENTS.md 和提示词模板。
介绍 OpenAI Codex for Open Source 官方开源计划:开源维护者如何申请 6 个月 ChatGPT Pro with Codex、API credits 和 Codex Security 相关权益。
介绍 open-slide:一个面向 AI Agent 的 React 幻灯片框架,用自然语言描述演示文稿,让 Agent 编写页面代码,框架负责预览、演示、导出和迭代。
介绍 OpenLess:一个面向 macOS 和 Windows 的开源语音输入工具,可以把口语转成经过 AI 润色的文字,并插入到当前光标位置。
介绍 Petdex:一个面向 Codex 的动态宠物图鉴网站,支持浏览、预览、安装和提交各种像素风 companion。
介绍 keep-codex-fast:一个面向 Codex 重度用户的本地状态维护 Skill,强调先检查、先交接、先备份,再安全归档旧会话、日志和工作区。
介绍 HeyGen 开源的 HyperFrames:一个用 HTML、CSS 和前端动画技术定义视频,并通过浏览器与 FFmpeg 渲染 MP4 的视频生成框架。
Multica 是一个开源 Managed Agents 平台,用看板、Issue、运行时和技能系统,把 Claude Code、Codex、OpenCode、Hermes 等编码 Agent 纳入团队协作流程。
基于 OpenAI Codex best practices 整理:如何通过上下文、Plan、AGENTS.md、配置、测试验证、MCP、Skill、Automation 和 session 管理,更稳定地使用 Codex。
介绍 h4ckf0r0day/obscura:一个用 Rust + V8 实现、兼容 Puppeteer/Playwright 的轻量无头浏览器,面向 AI Agent 和网页抓取场景。
介绍 forrestchang/andrej-karpathy-skills:把 Andrej Karpathy 对 LLM 编码问题的观察,整理成可直接用于 Claude Code、Cursor 和个人技能系统的协作准则。
介绍 Google Labs 推出的 DESIGN.md:用一个文件同时承载 design token 和设计说明,让 AI 编程工具更稳定地理解界面风格。
介绍 browser-use/browser-harness:一个基于 CDP 的轻量浏览器执行层,支持 AI 在任务中直接连接真实浏览器,并在执行过程中补齐缺失能力。
介绍 mnfst/manifest:一个面向个人 AI Agent 的开源模型路由器,支持按请求复杂度自动选模型、设置回退链路,并跟踪 token、成本与用量。
Superpowers 不是新的 Coding Agent,而是一套面向 Claude Code、Codex、Cursor 等工具的 skills 框架和开发方法论。它想解决的,不是 AI 会不会写代码,而是 AI 能不能按工程流程把项目稳定推进下去。
介绍 yizhiyanhua-ai/fireworks-tech-graph 这个 Claude Code Skill:它如何把自然语言描述转成可直接发布的 SVG + PNG 技术图,以及它适合哪些技术文档场景。
Paseo 不是新的大模型,也不是又一个 AI IDE。它更像是一层放在 Claude Code、Codex、OpenCode 外面的管理与调度工具,用来把多 agent 工作流统一起来,并延伸到手机、桌面端、Web 和 CLI。
分析 HKUDS/CLI-Anything:它如何把任意软件转换为 Agent 可调用的 CLI,并支持 Claude Code、OpenCode、Codex 等平台。
介绍 AlexsJones/llmfit:一款根据本机 CPU/GPU/RAM 自动推荐可运行 LLM 的终端工具,覆盖 TUI、CLI 与 API 三种模式。
先讲 mem9 与本地 memory 的核心差异,再讲场景与原理,帮助你判断是否该接入。
解析 NanmiCoder/MediaCrawler 的能力边界、技术方案、风险点与可落地场景,帮助你判断是否适合引入。
深入解析 NousResearch/hermes-agent 的定位、能力边界、适用人群与可变现方向,帮助你判断是否适合落地。
一个面向 AI 搜索优化(GEO)的 Claude Code 技能项目评测:能力边界、适用场景、快速上手与商业化机会。
整理 OpenClaw Skills 的高质量来源与筛选方法:ClawHub、官方文档、GitHub、社区实战,以及一套避免踩坑的选型流程。
用模板化方式拆解开源项目 AiToEarn:基础信息、核心能力、适用人群、优缺点与可变现方向。
OpenClaw 是一个可连接 Telegram、WhatsApp、浏览器和本地系统的 AI Agent 平台,让 AI 从聊天升级为可执行任务的助手。

