MotorBottle / Private-ASRLinks
本地部署音视频转文字区分说话人+LLM总结 - Moded from FunClip - Offline video/auduio Transcription + SD + LLM conclusion
☆43Updated 9 months ago
Alternatives and similar repositories for Private-ASR
Users that are interested in Private-ASR are comparing it to the libraries listed below
Sorting:
- 一个把长文转款成摘要卡片/图片的前端应用,使用 Kimi 对文章进行结构化总结。☆105Updated last month
- AI-StoryLab 是一款基于 Next.js 的智能故事创作平台,集成音频制作与 AI 绘图提示词生成功能。☆48Updated 8 months ago
- 视频转图文 AI跨平台客户端(win mac linux)☆323Updated 11 months ago
- coze-微信AI机器人一键运行包,下载exe双击直接使用。(该项目已停止维护,使用微信机器人请关注我的新项目(技术更合规,使用更简单) :https://github.com/ImGoodBai/GoodWeBot)☆158Updated last year
- AI视频剪辑☆229Updated last month
- EZ-Work AI文档翻译,人人可用的开源AI文档翻译助手,可以快速低成本调用OpenAI等大语言模型api,帮助您实现txt/markdown/word/csv/excel/pdf/ppt的文档翻译。☆246Updated 6 months ago
- 儿童有声读物的智能化自动化合生成,使用通义千问大模型+ Cosyvoice声音合成 + Flux 图像生成 + Paraformer 声音识别合成可用于生产的儿童有声读物☆100Updated last month
- 基于 Apache Airflow 的微信智能应用编排框架,通过可视化工作流驱动 AI 与数据自动化任务。支持 智能客服(多轮对话/知识库)、AI 图文/短视频生成、智能提醒等应用,灵活扩展多模态交互与大模型能力。☆70Updated 2 weeks ago
- 界面化批量上传视频抖音、bilibili、腾讯,及文字生成文字视频功能☆103Updated last year
- VoiceCanvas,支持Stripe支付的文本转语音系统,支持声音克隆,支持50+语言,支持选择音色,代码100%开源☆397Updated last month
- 基于 Google Gemini AI 的全功能图像处理应用☆221Updated 3 months ago
- AI Logo 是一款开源AI应用项目,旨在利用人工智能生成定制化的 logo。☆77Updated 6 months ago
- 因为考虑到譬如Sora等视频生成服务,遂有此从服务器端批量上传视频到国内网站(抖音,小红书,今日头条,哔哩哔哩)的Uploader☆69Updated last year
- FisherAI 是一款为提高学习效率而设计的Chrome插件,通过一键操作,支持自动摘要、网页及视频翻译、多轮对话等功能。此外,FisherAI 支持多种大语言模型,包括但不限于openai/gemini/deepseek/openrouter/siliconflow/…☆178Updated last week
- ☆40Updated 8 months ago
- ☆56Updated 4 months ago
- 图像魔方 - 一个强大的图像编辑和AI图片生成工具☆146Updated 3 weeks ago
- AI ContentCraft is an all-in-one content creation suite that helps creators generate stories, podcast scripts, and multimedia content usi…☆374Updated 2 months ago
- ☆126Updated last month
- ☆180Updated 7 months ago
- 专业的飞书文档转微信公众号编辑器,支持一键排版、Markdown 编辑、实时预览。完美支持飞书文档图片、表格、代码块等格式转换,让公众号排版更轻松。☆112Updated 3 months ago
- 基于 Nano Banana 的捏脸神器!精心打造您的完美肖像。使用控制选项,让 AI 将您的想象变为现实☆207Updated last week
- ⚡ 一款用于自动语音识别 (ASR)、翻译的高性能异步 API。不需要购买Whisper API,使用本地运行的Whisper模型进行推理,并支持多GPU并发,针对分布式部署进行设计。还内置了包括TikTok、抖音等社交媒体平台的爬虫,可实现来自多个社交平台的无缝媒体处理,…☆414Updated 3 months ago
- video_summarize(视频总结:上传视频通过prompt对视频内容经行总结输出)☆75Updated 2 years ago
- 基于whisper的实时语音识别 网页和桌面客户端☆180Updated last year
- 论文阅读工具,一键截图+AI翻译,支持数学公式,贴片多窗口管理☆121Updated last month
- 基于Next.js和Deepseek API开发的智能闪卡学习工具☆47Updated 8 months ago
- 《高军 AI 日报》: 每天花 1 分钟时间,获取精选的前沿 AI 信息。内容涵盖但不限于 前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程 等等。☆53Updated 9 months ago
- 全RPA技术实现完全合规,下载一键免安装运行,已接入coze等主流AI,使用超级简便的AI微信机器人☆254Updated 8 months ago
- 基于MoneyPrinterTurbo,AI生成分镜大纲与视频(动态,不是念ppt ),接入万相通义wan2.1 ai文生视频、图生视频功能,灵活把控视频生成。Based on MoneyPrinterTurbo, AI generates image outline and…☆201Updated 4 months ago