heyudage / VoiceTypingLinks
通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。
☆25Updated 3 years ago
Alternatives and similar repositories for VoiceTyping
Users that are interested in VoiceTyping are comparing it to the libraries listed below
Sorting:
- SummerAsr 是一个基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器。 Summer Asr is a Chinese automatic speech recognize project written with C++ that can be eas…☆99Updated 11 months ago
- 使用onnxruntime部署实时视频帧插值,包含C++和Python两个版本的程序☆27Updated last year
- 重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。☆49Updated 2 years ago
- chinese real time voice cloning☆38Updated 6 years ago
- some ncnn demos of FunASR☆28Updated last year
- 一个多语言支持、易使用的 OCR 项目。An easy-to-use OCR project with multilingual support.☆124Updated 4 years ago
- QGUI - 0.1MB超轻量Python GUI框架,用模板来快捷制作深度学习模型推理界面☆126Updated 2 years ago
- 使用onnxruntime部署LivePortrait人像动画生成,包含C++和Python两个版本的程序☆31Updated last year
- 使用onnxruntime部署facefusion换脸,包含C++和Python两个版本的程序☆121Updated last year
- 一个简单的音频降噪工具,提高web UI界面和api接口☆44Updated last year
- 离线语音合成☆34Updated 2 years ago
- 一个简单的语音助手框架实现,唤醒词为:“嘿 小二”。(rasa以及自训练的部分遗失了,在框架上适配了对开放平台接口的调用,可根据本地训练的模型对robot中对应功能进行扩展、替换)☆26Updated 6 years ago
- qwen2 and llama3 cpp implementation☆49Updated last year
- 读光中英文OCR onnx 版本模型使用 | Code for using the ONNX version of DuGuang OCR in both Chinese and English☆50Updated 2 weeks ago
- 语音技术:文字转语音☆46Updated 2 years ago
- Inference TinyLlama models on ncnn☆24Updated 2 years ago
- ASR (Automatic Speech Recognition) for real-time streamed audio powered by Whisper and tranformers☆36Updated 11 months ago
- 声纹识别☆26Updated 2 years ago
- 使用ONNXRuntime部署百度PaddleSeg发布的实时人像抠图模型PP-MattingV2,一共包含18个onnx模型,依然是包含C++和Python两个版本的程序☆34Updated 2 years ago
- PSGAN running with ncnn⚡妆容迁移/仿妆⚡Imitation Makeup/Makeup Transfer⚡☆194Updated 4 years ago
- 本系统以树莓派3B+为嵌入式计算平台,与CSI摄像头、二自由度旋转云台结合,主体使用Python和PHP编程,应用I2C通信与OpenCV等前沿技术,通过Frp内网穿透打通内外网数据传输,实现具有远程实时视频监控、运动检测及画面截图邮件预警、远程控制云台摄像头转动、监控画面…☆49Updated 3 years ago
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话,本地执行功能,支持 OpenAI,Grok, Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等AP…☆40Updated last month
- core for Final2x☆92Updated 2 months ago
- run chatglm3-6b in BM1684X☆40Updated last year
- Qwen-TTS offers a robust voice synthesis service using FastAPI, supporting bilingual and dialect options. Explore seamless audio generati…☆91Updated last week
- 基于MNN-llm的安卓手机部署大语言模型:Qwen1.5-0.5B-Chat☆85Updated last year
- 使用OpenCV+onnxruntime部署中文clip做以文搜图,给出一句话来描述想要的图片,就能从图库中搜出来符合要求的图片。包含C++和Python两个版本的程序☆84Updated last year
- pretrained models for cnocr☆56Updated 4 years ago
- a naive example of LivePortrait infer by ncnn☆43Updated last year
- PiDiNet running in Android by ncnn☆15Updated 4 years ago