快速开始
理解 Caption 最快的方法,不是先研究所有功能,而是先跑通一条完整路径。
推荐的第一次使用路径
- 先选一组最简单的输入源。 例如只用麦克风,或麦克风加系统音频。
- 启动一次简短的实时字幕会话。 确认字幕在持续更新,而且可读。
- 把这次结果保存成可以再次打开的会话。
- 找一段本地音视频,跑一次离线字幕流程。
- 之后再用时间点搜索找回一句已知内容。
如果这五步都顺畅,基本就验证了 Caption 的核心价值:采集、会中理解、会后处理、后续回找。
开始前先想清楚
这次会话真正需要哪些输入源:
- 麦克风
- 系统音频
- 某个 App 的输出
- 摄像头或视频录制
不要在第一次就把所有源都打开,除非场景确实需要。先把最小真实路径跑通,建立对工作流的信任。
第一次要确认的 5 件事
- 你预期的输入源确实都被纳入了。
- 实时字幕的可读性足以帮助你跟会。
- 这次会话的结果可以被重新打开。
- 一段本地素材可以顺利完成离线字幕生成。
- 一句已知内容之后可以通过时间点被找回来。