chinobing / FastAPI-PaddleSpeech-Audio-To-Text
FastAPI PaddleSpeech 音频录音转文字
☆50Updated 11 months ago
Alternatives and similar repositories for FastAPI-PaddleSpeech-Audio-To-Text:
Users that are interested in FastAPI-PaddleSpeech-Audio-To-Text are comparing it to the libraries listed below
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆47Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆74Updated 6 months ago
- EIVideo- 交互式智能视频标注工具,几次鼠标点击即可解放双手,让视频标注更加轻松☆30Updated 2 years ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- Whisper realtime streaming for long speech-to-text transcription and translation☆37Updated 11 months ago
- ☆52Updated 2 years ago
- 视频理解:千问视频多模态模型 & Dify☆46Updated 6 months ago
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆40Updated 2 years ago
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆26Updated 10 months ago
- 张艺谋(国师)一键声音克隆和恶搞文本生成项目☆17Updated last year
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆65Updated 2 months ago
- 数字人开源项目 (Digital human project)☆146Updated 2 years ago
- ☆47Updated last year
- 基于开源人脸检测AI模型,通过利用Java技术和向量搜索技术提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等API接口服务功能,为开发者和企业提供高性能高可用的人脸识别服务。可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身…☆38Updated 10 months ago
- 一个中文语音转文字项目,封装自FireRedASR☆39Updated last month
- 属于每个人的公众号”查特查特“上线啦!新问题、新方法、新发现,欢迎提PR!☆44Updated last year
- 调用微软TTS 在线语音合成,实现文字转语音功能,包含晓晓、云扬、云希等“网红主播”,通过python flask启动服务,快速访问使用☆79Updated 4 months ago
- wukong-robot项目是由github网友wzpan等开发并维护的一个开源中文语音对话机器人项目,能够让感兴趣的开发者快速打造个性化的智能音箱。 模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件 - 中文…☆54Updated 4 years ago
- openai标准的microsoft edge tts语音API [抱抱脸免费部署]☆20Updated 5 months ago
- ivideo 是一款轻量、强大、好用的视频处理软件。可以满足普通人一般的视频处理需求:压缩视频、转码视频、倒放视频、合并片段、根据字幕裁切片段、自动配字幕、自动剪辑……☆112Updated 2 years ago
- ASRT语音识别系统的Python版SDK☆51Updated 2 years ago
- Qwen 提示词工程 & 最佳实践☆23Updated last year
- run chatglm3-6b in BM1684X☆38Updated last year
- 中文论文、证券类、财报类PDF数据☆25Updated 9 months ago
- A Chinese Modular Speech Robot Framework Using Single-Wheel Dialogue Design | 一个采用单轮对话设计的中文模块化语音机器人框架☆13Updated last month
- 语音技术:文字转语音☆43Updated 2 years ago
- SenseVoice-python: A enterprise-grade open source multi-language asr system from funasr opensource with onnxruntime☆87Updated 6 months ago
- ☆118Updated 10 months ago
- CosyVoice语音合成简易API☆10Updated 4 months ago
- lang2openai☆68Updated 5 months ago