MotorBottle / Private-ASRLinks
本地部署音视频转文字区分说话人+LLM总结 - Moded from FunClip - Offline video/auduio Transcription + SD + LLM conclusion
☆49Updated last year
Alternatives and similar repositories for Private-ASR
Users that are interested in Private-ASR are comparing it to the libraries listed below
Sorting:
- 一个把长文转款成摘要卡片/图片的前端应用,使用 Kimi 对文章进行结构化总结。☆108Updated 5 months ago
- 《高军 AI 日报》: 每天花 1 分钟时间,获取精选的前沿 AI 信息。内容涵盖但不限于 前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程 等等。☆59Updated last year
- AI视频剪辑☆325Updated 2 months ago
- 一个用于F5-TTS的api和webui项目☆65Updated last year
- coze-微信AI机器人一键运行包,下载exe双击直接使用。(该项目已停止维护,使用微信机器人请关注我的新项目(技术更合规,使用更简单) :https://github.com/ImGoodBai/GoodWeBot)☆160Updated last year
- 界面化批量上传视频抖音、bilibili、腾讯,及文字生成文字视频功能☆105Updated last year
- WebUI for ChatTTS☆31Updated last year
- AI-StoryLab 是一款基于 Next.js 的智能故事创作平台,集成音频制作与 AI 绘图提示词生成功能。☆53Updated last year
- EZ-Work AI文档翻译,人人可用的开源AI文档翻译助手,可以快速低成本调用OpenAI等大语言模型api,帮助您实现txt/markdown/word/csv/excel/pdf/ppt的文档翻译。☆252Updated 10 months ago
- 基于 Apache Airflow 的微信智能应用编排框架,通过可视化工作流驱动 AI 与数据自动化任务。支持 智能客服(多轮对话/知识库)、AI 图文/短视频生成、智能提醒等应用,灵活扩展多模态交互与大模型能力。☆79Updated 2 weeks ago
- 因为考虑到譬如Sora等视频生成服务,遂有此从服务器端批量上传视频到国内网站(抖音,小红书,今日头条,哔哩哔哩)的Uploader☆71Updated last year
- 视频转图文 AI跨平台客户端(win mac linux)☆334Updated last year
- 包豆电脑是一款基于 豆包AI 视觉模型的智能控制系统,能够通过分析屏幕内容自动执行鼠标和键盘操作,实现任务自动化。☆188Updated last month
- ⚡ 一款用于自动语音识别 (ASR)、翻译的高性能异步 API。不需要购买Whisper API,使用本地运行的Whisper模型进行推理,并支持多GPU并发,针对分布式部署进行设计。还内置了包括TikTok、抖音等社交媒体平台的爬虫,可实现来自多个社交平台的无缝媒体处理,…☆451Updated 7 months ago
- ☆130Updated 5 months ago
- 将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型☆115Updated last year
- 基于 Google Gemini AI 的全功能图像处理应用☆240Updated 8 months ago
- 儿童有声读物的智能化自动化合生成,使用通义千问大模型+ Cosyvoice声音合成 + Flux 图像生成 + Paraformer 声音识别合成可用于生产的儿童有声读物☆107Updated 5 months ago
- ☆184Updated 2 months ago
- 基于 Nano Banana 的捏脸神器!精心打造您的完美肖像。使用控制选项,让 AI 将您的想象变为现实☆377Updated 4 months ago
- AI Logo 是一款开源AI应用项目,旨在利用人工智能生成定制化的 logo。☆79Updated 10 months ago
- ☆55Updated last year
- 图像魔方 - 一个强大的图像编辑和AI图片生成工具☆164Updated last month
- 一键将新闻链接转化为精美的财经简报,集成AI内容提炼、智能高亮、NanoBanana插图生成和长图导出功能☆332Updated 4 months ago
- 基于whisper的实时语音识别 网页和桌面客户端☆187Updated last year
- 一款可以让图片变成动态说话视频的ai代码 ai应用开发 软件开发 网站开发 小程序开发 请联系 vaan89☆77Updated 2 years ago
- video_summarize(视频总结:上传视频通过prompt对视频内容经行总结输出)☆79Updated 2 years ago
- fuckUhacker☆125Updated 3 months ago
- 用于kokoro TTS的webui界面和兼容openai api☆40Updated last year
- 基于Next.js和Deepseek API开发的智能闪卡学习工具☆49Updated last year