跳到主要内容
版本:2026 HER WAKA 活动

设置你的工具

在开始创建视频之前,先安装并连接好所有工具。这次需要的工具比平时多一些 —— 但我们会带你完成每一步。

你需要准备: 一台能联网的电脑。无需任何编程或视频剪辑经验 —— 我们会一步一步带你完成每个步骤。

  1. 安装 Wispr Flow(可选)

    此步骤是可选的。 Wispr Flow 让你可以说话代替打字 —— 如果你更喜欢说话而不是打字,会很方便。如果你更喜欢打字输入提示词,可以跳过此步骤。

    使用此邀请链接注册,获得一个月免费 Pro 版: https://wisprflow.ai/r?CHAN115

    你和教程作者都能受益 —— 你获得一个月免费 Pro,当你口述 2,000 个单词时,作者也会获得一个月免费!

    1. wisprflow.ai/r?CHAN115 注册
    2. 下载并安装适合你操作系统的应用
    3. 配置设置 —— 启用以下选项以获得最佳体验:
      • 实验性功能 > Command Mode —— 启用高级语音命令
      • Press Enter Command —— 当你说"press enter"时自动按回车
      • Bulk Import —— 导入片段和字典项目
    什么是 Wispr Flow?

    Wispr Flow 是一款语音转文字工具,让你可以口述代替打字。它在任何应用中都能使用,包括终端。与其向 Gemini CLI 打出一段长提示词,你可以直接说出来。如果你觉得打字慢或疲惫,这特别有用。

  2. 打开终端

    终端是一个你输入命令的程序。它看起来像一个带有文字的深色窗口 —— 这完全正常,不要被吓到!

    1. 按键盘上的 Windows 键
    2. 输入 PowerShell
    3. 在搜索结果中点击 Windows PowerShell

    你会看到一个带有闪烁光标的深蓝色窗口。那就是你的终端!

    终端是你输入命令来安装工具和与 AI 对话的地方。本教程中你会经常用到它 —— 保持它开着!

    如何在特定文件夹中打开终端

    在本教程的后续部分,你需要在项目文件夹内打开终端。方法如下:

    Windows: 在文件资源管理器中打开文件夹。点击顶部的地址栏,输入 powershell,然后按 Enter。终端会直接在那个文件夹中打开。

    macOS: 在 Finder 中导航到文件夹。右键单击文件夹并选择**"在文件夹中打开终端"**。如果看不到此选项,可以正常打开终端并输入 cd (带空格),然后将文件夹拖入终端窗口并按 Enter。

  3. 安装 Node.js

    已有 Node.js? 如果你在之前的教程中已经安装过,跳过此步骤。在终端运行 node --version 检查 —— 你应该会看到类似 v22.x.x 的版本号。

    Node.js 是一个免费工具,让你可以在电脑上运行 Gemini CLI。

    1. 前往 nodejs.org
    2. 点击绿色大按钮 LTS 下载安装程序
    3. 打开下载的 .msi 文件
    4. 点击下一步完成所有屏幕 —— 默认设置即可
    5. 点击安装,然后点击完成
    如何知道安装成功了?

    打开终端并输入:

    node --version

    你应该看到类似 v22.x.x 的版本号。如果看到错误,尝试关闭并重新打开终端,然后再次运行该命令。

  4. 安装你的 AI 助手

    你有两个选择。Gemini CLI 是免费的,效果很好。Claude Code 是 Remotion 官方推荐的付费替代方案 —— 功能更强大,但需要订阅。

    已有 Gemini CLI? 如果你在之前的教程中已经安装过,跳过此步骤。只需在终端运行 gemini,确认它仍可正常启动。

    Gemini CLI 是 Google 的免费 AI 助手。它在你的终端中运行,根据你的描述帮助你完成任务。

    打开终端并输入:

    npm install -g @google/gemini-cli

    等待安装完成。然后输入以下命令启动它:

    gemini

    第一次运行时,Gemini CLI 会要求你登录:

    • 选择 "Sign in with Google"
    • 浏览器窗口会打开 —— 用你的 Google 账号登录
    • 当提示已连接时,返回终端

    免费套餐: 每分钟 60 次请求,每天 1,000 次请求 —— 对于本教程和日常使用已绰绰有余。

    'npm' 未被识别

    这意味着 Node.js 没有正确安装。返回重新安装 Node.js。重新安装后,完全关闭终端并打开一个新的终端,然后再试一次。

    权限被拒绝错误

    Windows: 关闭 PowerShell,右键单击重新打开并选择**"以管理员身份运行"**,然后再次尝试安装命令。

    macOS: 在命令前加 sudo

    sudo npm install -g @google/gemini-cli

    在提示时输入你的电脑密码(输入时不会显示字符 —— 这是正常的)。

    输入 /quit 暂时退出 Gemini CLI。设置好视频项目后,我们会重新启动它。

  5. 获取你的 ElevenLabs API 密钥

    你需要 ElevenLabs API 密钥来生成配音音频和音效。这是免费的 —— 你只需要创建一个账号。

    1. 创建免费的 ElevenLabs 账号

      前往 elevenlabs.io 并点击 Sign Up。你可以用 Google 账号或邮箱注册。

    2. 找到你的 API 密钥

      登录后:

      1. 点击左下角的个人资料图标
      2. 点击 Profile + API key
      3. 点击 API 密钥旁边的 Show
      4. 点击复制图标将其复制到剪贴板
    3. 将你的 API 密钥保存在安全的地方

      将你的 API 密钥粘贴到文本文件、笔记或任何你能再次找到的地方。你在教程中会需要它。

      像对待密码一样对待你的 API 密钥。 不要公开分享它,不要发布在社交媒体上,也不要将其包含在你上传到 GitHub 的文件中。任何拥有你密钥的人都可以使用你的 ElevenLabs 账号。

    什么是 API 密钥?

    API 密钥就像一个让一个程序与另一个程序通信的密码。当你的 AI 助手生成配音音频时,它会将你的文字和 API 密钥一起发送到 ElevenLabs 的服务器。ElevenLabs 检查密钥以确认是你,然后发回音频。

    你会在很多专业工具中用到 API 密钥 —— 在这里学会使用它是一项可迁移的技能。

    免费套餐包含什么?

    ElevenLabs 免费套餐每月给你 10,000 个字符 —— 大约是 5 到 8 分钟的语音。对于一个 30 秒的宣传视频,你大约需要 75 到 100 个单词的配音。这意味着你每月可以在免费套餐上创建数十个视频

    免费套餐还包括音效生成和访问一组内置声音。

    我可以使用任何声音吗?

    免费 API 套餐包含几个内置声音(如 Rachel、Bella、Antoni 等)。拥有 3,000+ 社区声音的完整声音库可以在 ElevenLabs 网站上浏览,但通过 API 访问它们需要付费套餐。

    解决方法:elevenlabs.io/voice-library 浏览声音以听取预览。对于 API,使用内置声音 —— 它们听起来很专业,非常适合宣传视频。

  6. 创建你的视频项目

    现在让我们创建一个新的 Remotion 项目 —— 这是将你的描述转化为真实视频文件的框架。

    在终端中运行此命令:

    复制此命令
    npx create-video@latest

    当系统提示时,选择以下设置:

    • 项目名称: my-promo-video(或你喜欢的任何名称)
    • 模板: 选择 Blank
    • TailwindCSS: Yes
    • Install Skills: Yes

    刚才发生了什么? 你在电脑上创建了一个新的视频项目。Remotion 是一个从代码创建视频的框架 —— 但你永远不需要自己编写代码。你的 AI 助手会替你读取和编写所有代码。你安装的"Skills"是帮助 AI 理解 Remotion 工作原理的文档文件。

    然后进入项目文件夹并安装依赖:

    复制此命令
    cd my-promo-video
    复制此命令
    npm install
    'npx' 未被识别或命令失败

    确保 Node.js 已正确安装 —— 运行 node --version 检查。如果 Node.js 正常但 npx 失败,尝试关闭并重新打开终端。在 Windows 上,你可能需要以管理员身份运行终端。

    项目名称已存在

    选择一个不同的名称,或先删除现有文件夹。你可以使用任何你喜欢的名称 —— 只需记住在本教程剩余部分用该名称替换 my-promo-video

  7. 启动视频预览

    启动 Remotion 预览服务器,这样你就可以在构建视频时实时查看效果:

    复制此命令
    npm run dev

    这会在浏览器中打开一个预览窗口(通常在 http://localhost:3000)。你应该会看到一个空的视频画布。

    保持这个终端窗口运行。 预览服务器需要在你构建视频时保持活跃。在下一步中,你将打开第二个终端窗口来运行 AI 助手。

    浏览器没有自动打开

    手动打开浏览器并访问 http://localhost:3000。如果看到错误,确保终端显示"Server running"或类似内容 —— 可能需要一点时间启动。

  8. 在项目中启动你的 AI 助手

    打开一个新的终端窗口(保持第一个窗口中的预览服务器运行)。导航到你的项目文件夹并启动 AI 助手:

    复制此命令
    cd my-promo-video
    复制此命令
    gemini

    Gemini CLI 现在在你的视频项目内运行。它可以读取所有项目文件,并在你描述想要的内容时创建视频构图。

    同时运行两个终端: 这是正常且预期的情况。终端 1 运行预览服务器(这样你可以看到你的视频)。终端 2 运行你的 AI 助手(这样你可以描述你想要的内容)。它们协同工作 —— AI 编写代码,预览实时显示结果。

验证你的设置

Node.js 已安装

在终端运行 node --version,应显示一个版本号。

AI 助手已安装

在终端运行 geminiclaude,可正常启动并显示一个可输入的提示符。

ElevenLabs API 密钥已保存

你已复制并将 API 密钥保存在安全的地方 —— 文本文件、笔记或密码管理器。

Remotion 项目已创建

my-promo-video 文件夹存在于你的电脑上,其中包含项目文件。

预览服务器正在运行

终端 1 正在运行 npm run dev,你可以在 http://localhost:3000 看到 Remotion 预览。

AI 助手在项目中运行

终端 2 的 AI 助手(Gemini CLI 或 Claude Code)正在 my-promo-video 文件夹内运行。

一切就绪?前往创建你的第一个宣传视频,开始构建。