jianchang512 / zh_recognLinks
将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型
☆114Updated last year
Alternatives and similar repositories for zh_recogn
Users that are interested in zh_recogn are comparing it to the libraries listed below
Sorting:
- 通过LLM进行进行字幕断句分割,处理和优化字幕文件,将自动语音识别(ASR)数据的分段合并与拆分,☆130Updated 10 months ago
- VITS2 for Chinese speech | 最新VITS2中文语音合成☆132Updated 2 years ago
- video to video translation with voice clone and lip synchronization|带有语音克隆和口型同步的视频翻译,支持中英互换☆137Updated last year
- 微信视频号采集☆46Updated last year
- ☆39Updated last year
- ☆119Updated last year
- video_summarize(视频总结:上传视频通过prompt对视频内容经行总结输出)☆76Updated 2 years ago
- 基于whisper的实时语音识别 网页和桌面客户端☆180Updated last year
- edge-tts webui☆107Updated 2 years ago
- openai标准的microsoft edge tts语音API [抱抱脸免费部署]☆42Updated last year
- 不会聊天的字幕提取器不是一个好 B 站下载器~☆85Updated last week
- 一站式短视频拼接软件 无依赖,点击即用,自动去黑边,自动帧同步,自动调整分辨率,批量变更视频为横屏/竖屏☆490Updated last year
- 视频转图文 AI跨平台客户端(win mac linux)☆325Updated last year
- 界面化批量上传视频抖音、bilibili、腾讯,及文字生成文字视频功能☆104Updated last year
- Mac和Windows一键安装Stable Diffusion WebUI,LamaCleaner,SadTalker,ChatGLM2-6B,等AI工具,使用国内镜像,无需魔法。☆244Updated 2 years ago
- coze-微信AI机器人一键运行包,下载exe双击直接使用。(该项目已停止维护,使用微信机器人请关注我的新项目(技术更合规,使用更简单) :https://github.com/ImGoodBai/GoodWeBot)☆161Updated last year
- 微软文字转语音工具,edge-tts UI版本,增加了停顿功能☆203Updated last year
- 一个把长文转款成 摘要卡片/图片的前端应用,使用 Kimi 对文章进行结构化总结。☆105Updated 2 months ago
- 将excle小说转为剪映草稿的小工具☆30Updated 5 months ago
- 视频字幕处理工具 - 一站式视频字幕提取、翻译、烧录和内容总结解决方案。基于OpenAI Whisper和Google Gemini API,支持多语言处理、双语字幕、自定义烧录和智能视频内容总结。模块化设计,既可独立使用各功能,也可一键完成全流程处理。适合内容创作者、翻译…☆41Updated 6 months ago
- 一个开源的多角色、多情绪 AI 配音生成平台,支持小说、剧本、视频等内容的自动配音与导出。☆175Updated 2 weeks ago
- 因为考虑到譬如Sora等视频生成服务,遂有此从服务器端批量上传视频到国内网站(抖音,小红书,今日头条,哔哩哔哩)的Uploader☆69Updated last year
- 使用 Gemini AI 转写音视频为 SRT 字幕☆46Updated 9 months ago
- duckduckgo api 免费的无限制的搜索接口, 和免费的 ai chat gpt-4o-mini,claude-3-haiku,llama-3.1-70b,mixtral-8x7b☆42Updated 2 months ago
- 🚀🎬 Flexible, efficient, and scalable toolbox for editing and dubbing, unleashing creative potential☆117Updated this week
- ⚡ 一款用于自动语音识别 (ASR)、翻译的高性能异步 API。不需要购买Whisper API,使用本地运行的Whisper模型进行推理,并支持多GPU并发,针对分布式部署进行设计。还内置了包括TikTok、抖音等社交媒体平台的爬虫,可实现来自多个社交平台的无缝媒体处理,…☆424Updated 4 months ago
- ☆49Updated last year
- A server app to convert pdf to docx based on pdf2docx/ 基于 pdf2docx 将 pdf 转换为 docx 的服务程序☆53Updated last year
- 无需网页微信,基于图像识别的ai自动回复,可使用gpt4☆54Updated last year
- 最快油管英文视频转中文☆344Updated last year