chinobing / FastAPI-PaddleSpeech-Audio-To-TextLinks
FastAPI PaddleSpeech 音频录音转文字
☆52Updated last year
Alternatives and similar repositories for FastAPI-PaddleSpeech-Audio-To-Text
Users that are interested in FastAPI-PaddleSpeech-Audio-To-Text are comparing it to the libraries listed below
Sorting:
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆47Updated last year
- 视频理解:千问视频多模态模型 & Dify☆58Updated 9 months ago
- 一个简单的音频降噪工具,提高web UI界面和api接口☆32Updated 6 months ago
- Whisper realtime streaming for long speech-to-text transcription and translation☆46Updated last year
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆123Updated 3 years ago
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆41Updated 2 years ago
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆28Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆87Updated 9 months ago
- 一个中文语音转文字项目,封装自FireRedASR☆53Updated 3 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆64Updated 9 months ago
- Windows不用搭建环境只要英伟达显卡就行,解压即用!☆42Updated 10 months ago
- 张艺谋(国师)一键声音克隆和恶搞文本生成项目☆17Updated last year
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- ☆54Updated 2 years ago
- 属于每个人的公众号”查特查特“上线啦!新问题、新方法、新发现,欢迎提PR!☆45Updated last year
- ☆47Updated last year
- app会常驻手机后台,你可以随时随地保持与Fay数字人的沟通。☆45Updated 5 months ago
- A Chinese Modular Speech Robot Framework Using Single-Wheel Dialogue Design | 一个采用单轮对话设计的中文模块化语音机器人框架☆13Updated 4 months ago
- 用于企业微信自建应用的机器人代码库,实现消息回复、消息推送等功能。☆21Updated 9 months ago
- 基于Gradio开发的ChatGPT聊天应用,可以文字 或 语音对话,发送的音频通过OpenAI的STT转文本后,再通过ChatGPT生成回复,回复的内容通过OpenAI TTS合成后返回并自动播放,实现语音聊天功能。☆36Updated last year
- PaddleOCR 输出结果的行对齐,表格制式图像OCR行对齐☆44Updated 3 years ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆172Updated 3 weeks ago
- wukong-robot项目是由github网友wzpan等开发并维护的一个开源中文语音对话机器人项目,能够让感兴趣的开发者快速打造个性化的智能音箱。 模块化。功能插件、语音识别、语音合成、对话机器人都做到了高度模块化,第三方插件单独维护,方便继承和开发自己的插件 - 中文…☆56Updated 4 years ago
- AI Hub 是一个为了接入包括ChatGPT、Baichuan、Zhipu、混元、MiniMax、Moonshot等多种大型语言模型而设计的服务。它旨在积累和管理各种有效的模型调用提示(prompt),并对这些大型语言模型进行持续的测试和评估。☆72Updated 11 months ago
- Xiaozhi websocket protocol implemented by Golang, setup your own xiaozhi-server by routing requests to OpenAI Realtime API protocol such…☆34Updated 3 weeks ago
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆82Updated 4 months ago
- ChatTTS HTTP API☆53Updated 11 months ago
- 印章提取, 公章提取, 背景透明, 电子章☆104Updated 4 years ago
- 语音技术:文字转语音☆44Updated 2 years ago
- Automatically generate popular videos 自动生成热门视频☆46Updated 3 years ago