jianchang512 / zh_recognLinks
将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型
☆115Updated last year
Alternatives and similar repositories for zh_recogn
Users that are interested in zh_recogn are comparing it to the libraries listed below
Sorting:
- edge-tts webui☆108Updated 2 years ago
- 通过LLM进行进行字幕断句分割,处理和优化字幕文件,将自动语音识别(ASR)数据的分段合并与拆分,☆133Updated last year
- 微软文字转语音工具,edge-tts UI版本,增加了停顿功能☆206Updated last year
- video to video translation with voice clone and lip synchronization|带有语音克隆和口型同步的视频翻译,支持中英互换☆144Updated last year
- 不会聊天的字幕提取器不是一个好 B 站下载器~☆87Updated last week
- ☆39Updated 2 years ago
- video_summarize(视频总结:上传视频通过prompt对视频内容经行总结输出)☆78Updated 2 years ago
- 一站式短视频拼接软件 无依赖,点击即用,自动去黑边,自动帧同步,自动调整分辨率,批量变更视频为横屏/竖屏☆500Updated last year
- ☆119Updated last year
- 微信视频号采集☆47Updated last year
- A server app to convert pdf to docx based on pdf2docx/ 基于 pdf2docx 将 pdf 转换为 docx 的服务程序☆54Updated last year
- VITS2 for Chinese speech | 最新VITS2中文语音合成☆135Updated 2 years ago
- 小米坡word文档转视频生成工具,是一款基于windows平台下使用的word文档转视频工具。可以把word文档的图片转成视频、提取文档里边的文字转成配音、并生成字幕同步在视频上展示,支持加背景音乐。最终形成一个有配音、画面、字幕、背景音乐的完整视频。☆55Updated 5 months ago
- 基于whisper的实时语音识别 网页和桌面客户端☆188Updated last year
- 因为考虑到譬如Sora等视频生成服务,遂有此从服务器端批量上传视频到国内网站(抖音,小红书,今日头条,哔哩哔哩)的Uploader☆71Updated last year
- 界面化批量上传视频抖音、bilibili、腾讯,及文字生成文字视频功能☆105Updated last year
- 将excle小说转为剪映草稿的小工具☆30Updated 8 months ago
- 使用 Gemini AI 转写音视频为 SRT 字幕☆53Updated last year
- 使用CHATTTS合成语音,使用FASTAPI作为API服务端,基于GFAST制作了管理系统,提供了音色管理和webui界面☆35Updated last year
- 基于OpenVoice和Melotts整合的中文版webui,添加resemble_enhance音频增强功能☆100Updated last year
- duckduckgo api 免费的无限制的搜索接口, 和免费的 ai chat gpt-4o-mini,claude-3-haiku,llama-3.1-70b,mixtral-8x7b☆43Updated 5 months ago
- coze-微信AI机器人一键运行包,下载exe双击直接使用。(该项目已停止维护,使用微信机器人请关注我的新项目(技术更合规,使用更简单) :https://github.com/ImGoodBai/GoodWeBot)☆161Updated last year
- 视频转图文 AI跨平台客户端(win mac linux)☆332Updated last year
- openai标准的microsoft edge tts语音API [抱抱脸免费部署]☆50Updated last year
- Mac和Windows一键安装Stable Diffusion WebUI,LamaCleaner,SadTalker,ChatGLM2-6B,等AI工具,使用国内镜像,无需魔法。☆245Updated 2 years ago
- 本地部署音视频转文字区分说话人+LLM总结 - Moded from FunClip - Offline video/auduio Transcription + SD + LLM conclusion☆47Updated last year
- 这是一个 ChatTTS 音频仓库,包含用不同 seed 生成的不同音色,你可以方便地挑选你喜欢的 seed。☆51Updated last year
- Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型☆184Updated last year
- WebUI for ChatTTS☆31Updated last year
- FisherAI 是一款为提高学习效率而设计的Chrome插件,通过一键操作,支持自动摘要、网页及视频翻译、多轮对话等功能。此外,FisherAI 支持多种大语言模型,包括但不限于openai/gemini/deepseek/openrouter/siliconflow/…☆187Updated 3 months ago