jianchang512 / gemini-speech2srtLinks
使用 Gemini AI 转写音视频为 SRT 字幕
☆52Updated last year
Alternatives and similar repositories for gemini-speech2srt
Users that are interested in gemini-speech2srt are comparing it to the libraries listed below
Sorting:
- 将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型☆115Updated last year
- 将excle小说转为剪映草稿的小工具☆30Updated 8 months ago
- duckduckgo api 免费的无限制的搜索接口, 和免费的 ai chat gpt-4o-mini,claude-3-haiku,llama-3.1-70b,mixtral-8x7b☆43Updated 4 months ago
- 视频字幕处理工具 - 一站式视频字幕提取、翻译、烧录和内容总结解决方案。基于OpenAI Whisper和Google Gemini API,支持多语言处理、双语字幕、自定义烧录和智能视频内容总结。模块化设计,既可独立使用各功能,也可一键完成全流程处理。适合内容创作者、翻译…☆46Updated 9 months ago
- edge-tts webui☆109Updated 2 years ago
- 通过LLM进行进行字幕断句分割,处理和优化字幕文件,将自动语音识别(ASR)数据的分段合并与拆分,☆133Updated last year
- ☆39Updated 2 years ago
- 一个把长文转款成摘要卡片/图片的前端应用,使用 Kimi 对文章进行结构化总结。☆106Updated 4 months ago
- video_summarize(视频总结:上传视频通过prompt对视频内容经行总结输出)☆78Updated 2 years ago
- A modern web UI for the Qwen ASR model, featuring audio recording, PWA support, Picture-in-Picture mode, and local caching for fast, accu…☆239Updated 3 months ago
- video to video translation with voice clone and lip synchronization|带有语音克隆和口型同步的视频翻译,支持中英互换☆144Updated last year
- 批量给剪映工程添加关键帧☆61Updated 10 months ago
- A plugin that generates satirical explanation cards for Chinese phrases☆47Updated last year
- openai标准的microsoft edge tts语音API [抱抱脸免费部署]☆50Updated last year
- Secure Python client for XiaoHongShu (Little Red Book) API with token server architecture☆34Updated 7 months ago
- 多平台 文生图/图生图 等能力接入MCP☆192Updated last week
- FisherAI 是一款为提高学习效率而设计的Chrome插件,通过一键操作,支持自动摘要、网页及视频翻译、多轮对话等功能。此外,FisherAI 支持多种大语言模型,包括但不限于openai/gemini/deepseek/openrouter/siliconflow/…☆186Updated 3 months ago
- EZ-Work AI文档翻译,人人可用的开源AI文档翻译助手,可以快速低成本调用OpenAI等大语言模型api,帮助您实现txt/markdown/word/csv/excel/pdf/ppt的文档翻译。☆253Updated 9 months ago
- Jimeng AI Free 服务支持即梦超强图像与视频生成能力,包含即梦 4.0 文生图等多款模型,提供文生图、图生图、视频生成功能(官方每日赠 66 积分,可生成 66 次),零配置部署且支持多路 token。 接口与 OpenAI 完全兼容,需从即梦官网获取 sess…☆182Updated 3 weeks ago
- 包豆电脑是一款基于 豆包AI 视觉模型的智能控制系统,能够通过分析屏幕内容自动执行鼠标和键盘操作,实现任务自动化。☆163Updated last week
- 简单易用的封面图片生成工具,为你的文章、视频、社交媒体创作提供专业的封面设计。☆120Updated 7 months ago
- ☆137Updated 11 months ago
- 🚀 聆心智能 Emohaa情感陪伴大模型逆向API【特长:共情能力】,支持高速流式输出、多轮对话,零配置部署,多路token支持,自动清理会话痕迹,仅供测试,如需商用请前往官方开放平台。☆144Updated last year
- 无缝集成处理和调度 Dify & Dify on WeChat,Web 可视化多用户管理/一键启动 ChatBot,简化了令人惊叹且响应迅速的 ChatBot 应用程序的创建。☆71Updated last year
- chatgpt-on-wechat 医疗咨询插件☆26Updated last year
- 🐼基于LLM Agent的全能管家,通过语音或文字交互,调用工具控制智能家居(HomeAssistant/米家)和电脑。超高拓展性,无限可能。☆110Updated last year
- EasyVideoTrans 网页版 https://easyvideotrans.com/☆68Updated 2 months ago
- # Edge-TTS Web 一个基于 Microsoft Edge 浏览器 TTS 引擎的在线语音合成系统,提供简单易用的 Web 界面。 特性 🌍 支持多语言:中文(简体、繁体、粤语)、英语、日语等 74 种语言 - 🎭 丰富音色:提供 318 种不同的声音…☆67Updated last year
- 🌱 将智谱清言官方智能体API转换为OpenAI兼容协议的网关 👋 帮助开发者们降低接入API的门槛☆48Updated last year
- 🚀 讯飞星火大模型逆向API【特长:办公助手】,支持高速流式输出、智能体对话、联网搜索、AI绘图、长文档解读、图像解析、多轮对话,零配置部署,多路token支持,自动清理会话痕迹,仅供测试,如需商用请前往官方开放平台。。☆152Updated last year