8.7 KiB
| name | version | description |
|---|---|---|
| it-infra-evolution-video | v1 | 制作 IT 基础设施系列长图讲解视频。适用于 IT基础设施演进史、一图看懂视频、长图讲解视频、平台工程视频、网络/存储/安全/监控演进视频。默认使用 HyperFrames + edge-tts + 真实用户图/信息图素材,生成 1920x1080 横屏视频、中文口播、逐句字幕、BGM、章节 timeline tag,并完成 lint/inspect/snapshot/render/ffprobe 验证。 |
IT 基础设施系列长图讲解视频 Skill
Version Lock
- Version:
v1 - Status: read-only frozen template
- Do not mutate this skill in-place for v2 work. Create a new copy instead.
使用 HyperFrames + edge-tts + 用户长图/信息图素材 制作中文技术讲解视频。默认效果必须对齐样片 /Users/shenlan/workspaces/cloud-neutral-toolkit/docs/it-infra-evolution-video 的合成风格:蓝白技术纪录片视觉、双栏长图扫描、底部章节 timeline tag、高亮当前章节、深蓝字幕条和本地合成 BGM/SFX。样片里的 8 段完整结构、82 秒、8 列 timeline 是可提取的结构特征和默认配置,不是固定限制;实际章节数、总时长、timeline 列数必须由用户输入或生成配置决定。这个 skill 是 ai-tech-news-video 的独立派生副本,不要修改原始 ai-tech-news-video skill。
适用场景
触发词包括:
IT基础设施演进史一图看懂视频长图讲解视频平台工程视频网络演进视频存储演进视频账户与安全体系视频监控的前生今世与 AI 共同进化
适合把用户提供的一组小红书/海报/架构图/信息图,转成横屏讲解视频。
默认规格
- 默认画布:
1920x1080,16:9 横屏。 - 默认时长:用户未指定时使用样片配置
82s左右;用户指定时以用户配置为准。 - 默认语言:中文。
- 默认 voice:
zh-CN-YunxiNeural,--rate="+20%"到"+30%"。 - 默认结构:用户未指定时使用样片配置 8 个章节;用户指定时以用户的章节配置为准。
- 默认 timeline:列数等于章节数;用户未指定时使用样片配置 8 列。
- 必须包含:
- 真实素材清单:
assets/images/manifest.md - 每段口播音频
- 每段可读字幕
- BGM
- 章节 timeline tag,当前章节高亮
- HyperFrames
lint、inspect、snapshot - 最终 MP4
ffprobe分辨率、时长、音视频流校验
- 真实素材清单:
工作流
- 收集用户给定的长图/信息图素材。
- 建立 HyperFrames 项目,创建
assets/images/、assets/audio/、assets/audio/sfx/。 - 复制或引用素材,并写
assets/images/manifest.md。 - 产出章节配置:标题、口播、字幕、章节 tag、素材文件、
start、duration。章节数、总时长和 timeline 列数必须来自用户输入或生成配置。 - 用
edge-tts生成每段口播。 - 用
scripts/render_audio_bed.py生成 BGM 和转场音效,或接入用户提供 BGM。 - 基于
templates/index.html生成 HyperFrames 合成页面;默认不要重写视觉系统,按配置增删 scene、caption、timeline tag,并替换素材、标题、文案、音频时长和章节 tag。 - 运行:
npx --yes hyperframes@0.6.15 lint
npx --yes hyperframes@0.6.15 inspect --at 2,14,24,34,44,54,64,74
npx --yes hyperframes@0.6.15 snapshot --at 2,14,24,34,44,54,64,74
npx --yes hyperframes@0.6.15 render --output renders/it-infra-evolution.mp4 --quality standard
ffprobe -v quiet -show_entries format=duration,size:stream=codec_type,width,height,r_frame_rate -of json renders/it-infra-evolution.mp4
素材硬门槛
每个章节必须有真实素材。真实素材可以是:
- 用户提供的小红书/海报/信息图
- 官方页面截图
- 产品界面截图
- 架构图或技术图谱
- 公开资料截图
不要用纯 CSS 卡片、假界面、抽象图标或 AI 编造截图替代主素材。
assets/images/manifest.md 必须记录:
- 章节编号和标题
- 素材文件名
- 原始来源或用户提供路径
- 素材类型
- 该素材支撑哪段叙事
配置规则
先把用户输入沉淀成一个视频配置,再生成 HyperFrames 页面。配置字段至少包含:
duration: 总时长,秒。sections: 章节数组。每个章节包含id、start、duration、timeLabel、timelineLabel、title、subtitle、tags、image、voiceover、caption。timelineColumns: timeline 列数。默认等于sections.length,除非用户明确要求分组显示。inspectTimes: 每个章节中点时间,用于inspect和snapshot。
配置示例见 templates/video.config.example.json。这个文件只表达字段形状;正式项目应根据用户素材和节奏生成自己的配置。
结构参数优先级:
- 用户明确给出的时长、章节和节奏。
- 用户素材数量和叙事需要推导出的配置。
- 样片默认配置:8 段、82 秒、8 列 timeline。
详细模板见 references/storyboard-pattern.md。
叙事模板
用户未指定结构时,使用样片同款 8 段默认结构:
- 引言:这不是单点升级,而是一组能力共同进化。
- 基础设施主线:硬件、虚拟化、云、容器、治理、AI 原生。
- 账户与安全:边界从网络迁移到身份。
- 监控与可观测性:从事后告警到预测、定位、自愈。
- 网络与协议:从连接一切到理解一切。
- 存储服务:从存下来到高效流动。
- 平台工程:从人肉运维到平台化交付。
- 与 AI 共同进化:从工具系统到 AI 协同系统。
用户素材不足 8 张时,合并章节;用户素材更多时,按主题拆成 6-10 个章节,或按用户指定的章节数执行。总时长以用户配置为准;未指定时保持在 60-90 秒。
画面模板
默认使用样片同款蓝白技术纪录片风格:
- 左侧展示真实长图,右侧显示章节 kicker、标题、短说明和关键词 tags。
- 画布背景是白到浅蓝渐变,并带右上角 cyan 圆环装饰。
- 长图放在 760px 高、34px 圆角、白底阴影的
.image-panel内,默认object-fit: cover,需要完整展示时用.contain。 - 每段长图做
y: -70、scale: 1.1的缓慢扫描。 - 底部固定半透明 timeline tag,列数由
timelineColumns或sections.length决定,当前章节蓝绿渐变高亮并轻微上浮。 - 字幕位于 timeline 上方安全区,深蓝半透明底,左右
320px,底部132px。 - 不加关注、点赞、收藏等 CTA,除非用户明确要求。
实现细节见 references/hyperframes-it-infra-template.md,可从 templates/index.html 开始改。
样片一致性要求
当用户要求“和 it-infra-evolution.mp4 效果一致”或未指定其他风格时:
- 使用
templates/index.html的视觉和动效作为母版;其中 8 段/82 秒/8 列 timeline 是默认样片配置。 - 如果用户给出其他章节数、时长或 timeline 数量,按用户配置重排 scene、caption、timeline tag 和校验时间点。
- 保留 CSS 尺寸、颜色、圆角、阴影、caption、timeline、GSAP 动效参数。
- 只替换素材路径、章节文案、tag、音频文件名、
data-start和data-duration。 - 不改成深色 dashboard、三图并列、纯生成海报轮播或营销片风格。
- 如果用户提供的是 1-2 张总览长图,也仍然用双栏长图扫描和章节 tag 组织,不要退化成静态 PPT。
口播规则
- 每段 1-2 句,尽量 8-12 秒。
- 不说“第一条、第二条”。
- 不说无关自我介绍。
- 字幕可以略短于口播,但必须覆盖关键含义。
- 每个
<audio>clip 必须有对应字幕 clip。 - 生成后用
ffprobe读取音频时长,再把data-start/data-duration写入 HTML。
示例:
edge-tts --voice zh-CN-YunxiNeural --rate='+20%' \
--text 'IT 基础设施演进史,不只是服务器升级。它是一组能力的共同进化。' \
--write-media assets/audio/intro.mp3
BGM 与音效
- 先检查项目是否已有
assets/audio/bgm.mp3或assets/audio/bgm.wav。 - 若没有,可使用本 skill 的
scripts/render_audio_bed.py生成本地合成 BGM 和转场音效。 - BGM 音量建议
data-volume="0.08"到0.12。 - 口播音量建议
data-volume="0.90"到0.95。 - Web Audio API 不会进入 HyperFrames MP4,所有音频必须使用
<audio class="clip">。
验收标准
npx hyperframes lint无 error。npx hyperframes inspect无布局 error;图片 zoom 裁切 warning 可接受。snapshot至少覆盖每个章节的中间时刻。- 最终 MP4 使用
ffprobe确认为1920x1080、有 video stream、有 audio stream、时长符合预期。 - 原始
ai-tech-news-videoskill 未被修改。