chinobing / FastAPI-PaddleSpeech-Audio-To-TextLinks
FastAPI PaddleSpeech 音频录音转文字
☆50Updated last year
Alternatives and similar repositories for FastAPI-PaddleSpeech-Audio-To-Text
Users that are interested in FastAPI-PaddleSpeech-Audio-To-Text are comparing it to the libraries listed below
Sorting:
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆48Updated 2 years ago
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎,掌握向量数据库和以图搜图、文本搜索图片。☆144Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆90Updated 10 months ago
- 属于每个人的公众号”查特查特“上线啦!新问题、新方法、新发现,欢迎提PR!☆45Updated last year
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆123Updated 3 years ago
- Based on RapidOCR, extract the PDF content☆174Updated 2 months ago
- Windows不用搭建环境只要英伟达显卡就行,解压即用!☆45Updated last year
- 基于 Serverless 架构部署通用文字识别 PaddleOCR☆122Updated 7 months ago
- DangoOCR: screenshot OCR recognize 文字识别,支持多种语言,识别后翻译,播放声音☆53Updated 4 years ago
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆90Updated 5 months ago
- 视频理解:千问视频多模态模型 & Dify☆60Updated 10 months ago
- 张艺谋(国师)一键声音克隆和恶搞文本生成项目☆17Updated 2 years ago
- ☆54Updated 2 years ago
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆28Updated last year
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆41Updated 3 years ago
- wukong-robot的一键安装脚本.☆97Updated 2 years ago
- 流水线系统(pipeline)构建基于本地知识库的ChatGLM问答☆87Updated 2 years ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆67Updated 10 months ago
- 😆 Generate PPT by LLM follow your template. 📢 Not only use llm to generate ppt, but also according to your favorite ppt template. Just…☆89Updated last year
- C++开发的视频行为分析系统v4版本☆187Updated last week
- 基于youtube、bilibili等视频平台、webpage网页等,利用零一万物大模型或ollama本地小模型构建大语言模型高质量训练数据集(计划支持可自定义输出的训练数据格式)☆18Updated last year
- 基于Unsloth框架下,使用llama3大模型为基底的模型微调☆17Updated 4 months ago
- offline 2d digitalhuman demo for edge devices (android/ios/etc.)☆75Updated last year
- 一个中文语音转文字项目,封装自FireRedASR☆64Updated 4 months ago
- 🤗【欧小鹏】辅助社区运营,支持文生图、闲聊等群活跃技能,以及社群自动问答等辅助管理功能。☆62Updated last year
- 离线语音合成☆34Updated 2 years ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆79Updated 6 months ago
- ☆48Updated last year
- MinerU API server☆65Updated 6 months ago