jianchang512 / gemini-speech2srtLinks
使用 Gemini AI 转写音视频为 SRT 字幕
☆39Updated 7 months ago
Alternatives and similar repositories for gemini-speech2srt
Users that are interested in gemini-speech2srt are comparing it to the libraries listed below
Sorting:
- 将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型☆110Updated last year
- 将excle小说转为剪映草稿的小工具☆28Updated 3 months ago
- video_summarize(视频总结:上传视频通过prompt对视频内容经行总结输出)☆73Updated last year
- video to video translation with voice clone and lip synchronization|带有语音克隆和口型同步的视频翻译,支持中英互换☆136Updated last year
- 一个用于F5-TTS的api和webui项目☆62Updated 7 months ago
- 无缝集成处理和调度 Dify & Dify on WeChat,Web 可视化多用户管理/一键启动 ChatBot,简化了令人惊叹且响应迅速的 ChatBot 应用程序的创建。☆70Updated 11 months ago
- edge-tts webui☆107Updated 2 years ago
- ☆39Updated last year
- 批量给剪映工程添加关键帧☆56Updated 5 months ago
- WebUI for ChatTTS☆30Updated last year
- EZ-Work AI文档翻译,人人可用的开源AI文档翻译助手,可以快速低成本调用OpenAI等大语言模型api,帮助您实现txt/markdown/word/csv/excel/pdf/ppt的文档翻译。☆244Updated 4 months ago
- 🌎 free-api系列项目文档站点,贡献文档请前往LLM-Red-Team/free-api-docs☆53Updated last year
- A plugin that generates satirical explanation cards for Chinese phrases☆47Updated 10 months ago
- 🚀 MiniMax大模型海螺AI逆向API【特长:超自然语音】,支持MiniMax Text-01、MiniMax-VL-01模型,支持高速流式输出、语音合成、联网搜索、长文档解读、图像解析、多轮对话,零配置部署,多路token支持,自动清理会话痕迹,仅供测试,如需商用请…☆378Updated 6 months ago
- duckduckgo api 免费的无限制的搜索接口, 和免费的 ai chat gpt-4o-mini,claude-3-haiku,llama-3.1-70b,mixtral-8x7b☆40Updated 2 months ago
- 视频转图文 AI跨平台客户端(win mac linux)☆320Updated 10 months ago
- ⚡ 一款用于自动语音识别 (ASR)、翻译的高性能异步 API。不需要购买Whisper API,使用本地运行的Whisper模型进行推理,并支持多GPU并发,针对分布式部署进行设计。还内置了包括TikTok、抖音等社交媒体平台的爬虫,可实现来自多个社交平台的无缝媒体处理,…☆397Updated last month
- 本地部署音视频转文字区分说话人+LLM总结 - Moded from FunClip - Offline video/auduio Transcription + SD + LLM conclusion☆41Updated 7 months ago
- 一个把长文转款成摘要卡片/图片的前端应用,使用 Kimi 对文章进行结构化总结。☆105Updated 8 months ago
- 基于whisper的实时语音识别 网页和桌面客户端☆180Updated 10 months ago
- TTS☆78Updated last year
- 免费接入 GPT4 , DALL-E3 API , 还提供 Google&Bing 搜索 , BiliBili搜索 等众多插件☆179Updated last year
- coze-微信AI机器人一键运行包,下载exe双击直接使用。(该项目已停止维护,使用微信机器人请关注我的新项目(技术更合规,使用更简单) :https://github.com/ImGoodBai/GoodWeBot)☆159Updated 10 months ago
- FisherAI 是一款为提高学习效率而设计的Chrome插件,通过一键操作,支持自动摘要、网页及视频翻译、多轮对话等功能。此外,FisherAI 支持多种大语言模型,包括但不限于openai/gemini/deepseek/openrouter/siliconflow/…☆170Updated last month
- 因为考虑到譬如Sora等视频生成服务,遂有此从服务器端批量上传视频到国内网站(抖音,小红书,今日头条,哔哩哔哩)的Uploader☆69Updated last year
- 将豆包强大的文生图能力接入MCP☆126Updated 3 weeks ago
- 通过LLM进行进行字幕断句分割,处理和优化字幕文件,将自动语音识别(ASR)数据的分段合并与拆分,☆118Updated 7 months ago
- 🌱 将智谱清言官方智能体API转换为OpenAI兼容协议的网关 👋 帮助开发者们降低接入API的门槛☆48Updated last year
- 封装GPT-Sovits-Interface,可用于用于多角色多情感有声中文小说制作☆31Updated last year
- 不会聊天的字幕提取器不是一个 好 B 站下载器~☆83Updated 2 weeks ago