chinobing / FastAPI-PaddleSpeech-Audio-To-TextLinks
FastAPI PaddleSpeech 音频录音转文字
☆51Updated last year
Alternatives and similar repositories for FastAPI-PaddleSpeech-Audio-To-Text
Users that are interested in FastAPI-PaddleSpeech-Audio-To-Text are comparing it to the libraries listed below
Sorting:
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆50Updated 2 years ago
- Based on RapidOCR, extract the PDF content☆184Updated 8 months ago
- CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直…☆51Updated last year
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆35Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆104Updated last year
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 3 years ago
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎 ,掌握向量数据库和以图搜图、文本搜索图片。☆150Updated 2 years ago
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆123Updated 6 months ago
- 基于 Serverless 架构部署通用文字识别 PaddleOCR☆125Updated 4 months ago
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆130Updated 3 years ago
- Whisper realtime streaming for long speech-to-text transcription and translation☆59Updated last year
- 基于whisper的一个web项目套壳☆21Updated 3 years ago
- 调用微软TTS 在线语音合成,实现文字转语音功能,包含晓晓、云扬、云希等“网红主播”,通过python flask启动服务,快速访问使用☆107Updated 9 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆90Updated last year
- Unsloth框架在Windows平台微调训练Qwen2大模型,非WSL☆62Updated last year
- ☆54Updated 3 years ago
- 一个中文语音转文字项目,封装自FireRedASR☆82Updated 10 months ago
- ☆49Updated 2 years ago
- funasr语音转文字的简单api版本,funasr+fastapi,方便部署在服务器上☆13Updated last year
- 基于Unsloth框架下,使用llama3大模型为基底的模型微调☆17Updated 10 months ago
- lang2openai☆74Updated last year
- 批量自动化生成儿童绘本故事书☆50Updated last year
- ☆119Updated last year
- 基于 faster-whisper 的伪实时语音转写服务☆235Updated 8 months ago
- 使用CHATTTS合成语音,使用FASTAPI作为API服务端,基于GFAST制作了管理系统,提供了音色管理和webui界面☆35Updated last year
- 基于cnstd+cnocr作为基础,封装的一个ocr的web服务☆11Updated 4 years ago
- 企业级多平台AI代理服务,大模型代理服务,aiproxy、AI Proxy,支持 Azure、Anthropic Claude、Google PaLM 2 & Gemini、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问、360 智脑、腾讯混元、豆包☆31Updated last year
- 视频理解:千问视频多模态模型 & Dify☆66Updated last year
- 基于 NSFW Model 色情图片识别鉴黄 后面更新视频检测☆31Updated 3 years ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆181Updated 2 months ago