chinobing / FastAPI-PaddleSpeech-Audio-To-TextLinks
FastAPI PaddleSpeech 音频录音转文字
☆52Updated last year
Alternatives and similar repositories for FastAPI-PaddleSpeech-Audio-To-Text
Users that are interested in FastAPI-PaddleSpeech-Audio-To-Text are comparing it to the libraries listed below
Sorting:
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆50Updated 2 years ago
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆104Updated last year
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎,掌握向量数据库和以图搜图、文本搜索图片。☆151Updated 2 years ago
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆35Updated last year
- Based on RapidOCR, extract the PDF content☆185Updated 9 months ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆304Updated last month
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推 理,中英文OCR开源…☆124Updated last week
- 基于 Serverless 架构部署通用文字识别 PaddleOCR☆125Updated 5 months ago
- ☆54Updated 3 years ago
- 你是否曾经幻想过与自己的虚拟人交互?现在,使用PaddleAvatar,您可以将自己的图像、音频和视频转化为一个逼真的数字人视频,与其进行人机交互。 PaddleAvatar是一种基于PaddlePaddle深度学习框架的数字人生成工具,基于Paddle的许多套件,它可以…☆223Updated last year
- 视频理解:千问视频多模态模型 & Dify☆66Updated last year
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆131Updated 3 years ago
- 洛曦 数字人视频播放器,带HTTP API,使用gradio api对接Easy-Wav2Lip、Sadtalker、GeneFacePlusPlus、MuseTalk,也可以用于播放本地视频☆175Updated last year
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆43Updated 3 years ago
- 以图搜图基于Towhee(resnet50 模型) + Milvus☆74Updated last year
- 基于 faster-whisper 的伪实时语音转写服务☆237Updated 9 months ago
- 数字人授课录制系统——全新的微课视频的生成方案——API☆79Updated last year
- 语音技术:文字转语音☆46Updated 2 years ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆92Updated last year
- 智慧安防平台,基于asmoboot项目:https://github.com/RotaNova/asmoboot 具备高效、稳定的流媒体,支持主流摄像头接入。定制AI识别,跨境追踪。边缘计算,AI使能指挥大厅。☆87Updated 3 years ago
- ☆119Updated last year
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆156Updated 4 years ago
- This is a web-based intelligent dialogue program built using ASR, LLM, and TTS.☆24Updated last year
- 😆 Generate PPT by LLM follow your template. 📢 Not only use llm to generate ppt, but also according to your favorite ppt template. Just…☆98Updated last year
- 数字人授课录制系统——全新的微课视频的生成方案——UI☆44Updated last year
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 3 years ago
- 数字人开源项目 (Digital human project)☆158Updated 3 years ago
- “alibabacloud-nls-python-sdk提供使用阿里云智能语音服务的能力,包括语音识别、语音合成、文件转写等。”☆77Updated 5 months ago
- 调用微软TTS 在线语音合成,实现文字转语音功能,包含晓晓、云扬、云希等“网红主播”,通过python flask启动服务,快速访问使用☆108Updated 10 months ago
- Whisper realtime streaming for long speech-to-text transcription and translation☆59Updated last year