chinobing / FastAPI-PaddleSpeech-Audio-To-Text
FastAPI PaddleSpeech 音频录音转文字
☆48Updated 8 months ago
Alternatives and similar repositories for FastAPI-PaddleSpeech-Audio-To-Text:
Users that are interested in FastAPI-PaddleSpeech-Audio-To-Text are comparing it to the libraries listed below
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆45Updated last year
- 百聆 是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,时延低至800ms,低配置也可运行,支持打断☆66Updated last month
- ☆42Updated last year
- 张艺谋(国师)一键声音克隆和恶搞文本生成项目☆17Updated last year
- ☆51Updated 2 years ago
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆51Updated 4 months ago
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎,掌握向量数据库和以图搜图、文本搜索图片。☆115Updated last year
- Whisper realtime streaming for long speech-to-text transcription and translation☆31Updated 9 months ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆40Updated 2 years ago
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆21Updated 7 months ago
- 以图搜图基于Towhee(resnet50 模型) + Milvus☆45Updated 4 months ago
- DangoOCR: screenshot OCR recognize 文字识别,支持多种语言,识别后翻译,播放声音☆51Updated 3 years ago
- 使用 FastAPI、Streamlit本地部署ChatTTS文本转语音模型,并通过 Docker Compose 进行容器化部署。☆25Updated 3 months ago
- Windows不用搭建环境只要英伟达显卡就行,解压即用!☆34Updated 6 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆34Updated 4 months ago
- 语音技术:文字转语音☆43Updated last year
- 批量自动化生成儿童绘本故事书☆16Updated last month
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆130Updated this week
- 洛曦 数字人视频播放器,带HTTP API,使用gradio api对接Easy-Wav2Lip、Sadtalker、GeneFacePlusPlus、MuseTalk,也可以用于播放本地视频☆156Updated 2 months ago
- ☆117Updated 7 months ago
- chatgpt-plugins open source version.Open-ChatGPT-Plugins 旨在构建一个开放、多元化的聊天机器人插件生态系统。使得开发者可以轻松地为 ChatGPT 模型增添新的功能和交互体验。☆22Updated last year
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- 数字人开源项目 (Digital human project)☆144Updated 2 years ago
- 一个用于CosyVoice的api接口项目☆145Updated 3 weeks ago
- ☆19Updated last year
- 视频理解:千问视频多模态模型 & Dify☆30Updated 4 months ago
- 调用微软TTS 在线语音合成,实现文字转语音功能,包含晓晓、云扬、云希等“网红主播”,通过python flask启动服务,快速访问使用☆75Updated 2 months ago
- 自动批量上传并解析文档至 RagFlow 知识库,省去手动操作,提升效率。☆46Updated 3 months ago