jianchang512 / fireredasr-ui
一个中文语音转文字项目,封装自FireRedASR
☆34Updated last month
Alternatives and similar repositories for fireredasr-ui:
Users that are interested in fireredasr-ui are comparing it to the libraries listed below
- ☆47Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆74Updated 6 months ago
- 一个基于 Funasr 的离线字幕生成工具~☆63Updated this week
- 将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型☆103Updated 8 months ago
- Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型☆174Updated 8 months ago
- 使用 Gemini AI 转写音视频为 SRT 字幕☆23Updated 2 months ago
- 微信视频号采集☆39Updated 7 months ago
- 基于OpenVoice和Melotts整合的中文版webui,添加resemble_enhance音频增强功能☆91Updated 10 months ago
- A server app to convert pdf to docx based on pdf2docx/ 基于 pdf2docx 将 pdf 转换为 docx 的服务程序☆38Updated 6 months ago
- 🐼基于LLM Agent的全能管家,通过语音或文字交互,调用工具控制智能家居(HomeAssistant/米家)和电脑。超高拓展性,无限可能。☆95Updated 3 months ago
- 一个简单的音频降噪工具,提高web UI界面和api接口☆23Updated 4 months ago
- Streaming ASR and TTS based on FastAPI+ sherpa-onnx☆86Updated 5 months ago
- 《高军 AI 日报》: 每天花 1 分钟时间,获取精选的前沿 AI 信息。内容涵盖但不限于 前沿 AI 资讯、AI 工具、AI 绘画、开源项目和学习教程 等等。☆44Updated 3 months ago
- ChatTTS HTTP API☆52Updated 9 months ago
- # Edge-TTS Web 一个基于 Microsoft Edge 浏览器 TTS 引擎的在线语音合成系统,提供简单易用的 Web 界面。 特性 🌍 支持多语言:中文(简体、繁体、粤语)、英语、日语等 74 种语言 - 🎭 丰富音色:提供 318 种不同的声音…☆53Updated 3 months ago
- Sample Repository for the AlibabaCloud Bailian Speech SDK☆135Updated this week
- 用于kokoro TTS的webui界面和兼容openai api☆30Updated last month
- 用于SenseVoice的api项目,输出带时间戳字幕☆34Updated 5 months ago
- Ollama 模型 Registry 镜像站 / 加速器,让 Ollama 从 ModelScope 魔搭 更快的 拉取 / 下载 模型。☆77Updated 3 weeks ago
- 基于 faster-whisper 的伪实时语音转写服务☆204Updated 6 months ago
- 在DH_live项目基础上修改,添加webui界面☆56Updated 4 months ago
- 一个用于CosyVoice的api接口项目☆247Updated 2 months ago
- Fast-TTS 是一个基于异步框架的文本到语音转换(TTS)生成器项目。该项目利用了异步编程技术来高效处理请求和响应,实现了快速、秒级的流式生成长文本语音播放服务。Fast-TTS 可以快速地将长文本转换为语音流,并实时播放,适用于多种应用场景,如语音合成、智能助手、内容…☆32Updated 3 months ago
- Whisper realtime streaming for long speech-to-text transcription and translation☆37Updated 11 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆51Updated 6 months ago
- 通过LLM进行进行字幕断句分割,处理和优化字幕文件,将自动语音识别(ASR)数据的分段合并与拆分,☆97Updated 3 months ago
- 这是一个 ChatTTS 音频仓库,包含用不同 seed 生成的不同音色,你可以方便地挑选你喜欢的 seed。☆48Updated 9 months ago
- 一个用于F5-TTS的api和webui项目☆54Updated 3 months ago
- https://groq.com/ API代理,借助Deno 的能力,实现国内直连☆73Updated 8 months ago
- 这是一个基于 `PyQt5` 和 `Python` 的网络信息抓取工具,可自动从互联网搜索引擎中抓取与关键词相关的内容,并将结果保存至本地文件,同时支持文本复制到剪贴板。支持的搜索引擎包括 Google, Bing, Baidu, 和 Sogou。This is a web…☆25Updated 10 months ago