heyudage / VoiceTypingLinks
通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。
☆25Updated 2 years ago
Alternatives and similar repositories for VoiceTyping
Users that are interested in VoiceTyping are comparing it to the libraries listed below
Sorting:
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆49Updated 2 years ago
- chinese real time voice cloning☆38Updated 5 years ago
- 使用onnxruntime部署facefusion换脸,包含C++和Python两个版本的程序☆118Updated last year
- 使用onnxruntime部署LivePortrait人像动画生成,包含C++和Python两个版本的程序☆30Updated last year
- 一个多语言支持、易使用的 OCR 项目。An easy-to-use OCR project with multilingual support.☆124Updated 3 years ago
- some ncnn demos of FunASR☆27Updated last year
- 离线语音合成☆34Updated 2 years ago
- 使用onnxruntime部署实时视频帧插值,包含C++和Python两个版本的程序☆26Updated last year
- Qwen-TTS offers a robust voice synthesis service using FastAPI, supporting bilingual and dialect options. Explore seamless audio generati…☆68Updated this week
- 使用ONNXRuntime部署CodeFormer图像清晰修复,包含C++和Python两个版本的程序☆39Updated 2 years ago
- ChatTTS HTTP API☆54Updated last year
- 一个模块化,全过程可离线,低占用率的对话机器人/智能音箱☆108Updated 7 months ago
- QGUI - 0.1MB超轻量Python GUI框架,用模板来快捷制作深度学习模型推理界面☆127Updated last year
- a naive example of LivePortrait infer by ncnn☆43Updated last year
- 使用ONNXRuntime部署百度PaddleSeg发布的实时人像抠图模型PP-MattingV2,一共包含18个onnx模型,依然是包含C++和Python两个版本的程序☆33Updated 2 years ago
- 一个简单的音频降噪工具,提高web UI界面和api接口☆41Updated 10 months ago
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆79Updated last year
- 声纹识别☆23Updated last year
- 用于SenseVoice的api项目,输出带时间戳字幕☆40Updated 11 months ago
- 基于MNN-llm的安卓手机部署大语言模型:Qwen1.5-0.5B-Chat☆85Updated last year
- qwen2 and llama3 cpp implementation☆47Updated last year
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆106Updated 2 months ago
- An easy use face swap tool for images and tools only depend on onnxruntime.☆78Updated last year
- 使用 PaddleGAN 套件的 Wave2lip 模型给照片上的人“配音、配嘴型儿”~~☆26Updated 4 years ago
- EIVideo- 交互式智能视频标注工具,几次鼠标点击即可解放双手,让视频标注更加轻松☆31Updated 3 years ago
- 使用ONNXRuntime部署人脸动漫化——AnimeGAN,包含C++和Python两个版本的代码实现☆44Updated 3 years ago
- ☆14Updated last year
- 这个库包含了完整的小车控制程序,以及基于树莓派4B从零开始制作树莓派小车的详细步骤方法。制作小车文章地址https://huoyijie.cn/article/3b8281b1e8aa6a1d8bc6718a4256b141/☆54Updated 4 years ago
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话, 本地执行功能,支持 OpenAI,Grok, Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等AP…☆40Updated 4 months ago
- 语音技术:文字转语音☆46Updated 2 years ago