技能库 / 开发工具 / Gemini 极速语音转文字

Gemini 极速语音转文字

利用 Google Gemini API 或 Vertex AI 快速转录音频文件,默认采用 gemini-2.0-flash-lite 模型实现极速语音转文字,零依赖 Python 脚本支持多种音频格式。

CLS 安全 A 源可信度 T3 热度 7.4万 安装 2 站长推荐
v1.1.0 araa47
speech-to-text transcription google-ai gemini-api vertex-ai audio-processing cli-tool clawdbot gcp voice-message

安装方式

CLI 安装(推荐)

claw install cc-11630

需要安装 CLAW CLI

手动下载安装

下载 ZIP 后解压到技能目录即可安装。若在桌面客户端 WebView中直接下载出现异常,本站会改为提示页 + 原始链接,请按页内说明操作。

下载 ZIP (cc-11630-v1.1.0.zip)

跨平台安装指引

该技能声明兼容以下 1 个平台,将 ZIP 解压到对应目录即可被识别。

支持矩阵
macOS / Linux:~/.openclaw/skills/
Windows:%USERPROFILE%\.openclaw\skills\
unzip cc-11630-v1.1.0.zip -d ~/.openclaw/skills/
目录不存在时请先 mkdir -p 创建;启用 Skill 后请重启对应 Agent 让配置生效。

使用指南

Gemini 极速语音转文字

概述

利用 Google Gemini API 或 Vertex AI 快速转录音频文件,默认采用 gemini-2.0-flash-lite 模型实现极速语音转文字,零依赖 Python 脚本支持多种音频格式。

oss-* 官方示例技能相同:完整命令、参数与进阶说明见本技能 ZIP 包SKILL.md(与上游一致)。若需在本站展示长文中文指南,请新增 resources/skill-docs/zh/cc-11630.md(首行 <!-- zh-only -->)。

技能信息

  • 版本:1.1.0
  • 作者:araa47
  • 分类:开发工具

触发方式

请下载技能包并查阅包内 SKILL.md 中的触发与用法说明。

相关标签

speech-to-text、transcription、google-ai、gemini-api、vertex-ai、audio-processing、cli-tool、clawdbot、gcp、voice-message