tiansztiansz / voice-assistantLinks
重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。
☆49Updated 2 years ago
Alternatives and similar repositories for voice-assistant
Users that are interested in voice-assistant are comparing it to the libraries listed below
Sorting:
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆99Updated last year
- 本地完整部署ASR(K2)-NLP(Rasa,Spacy)-LLM(Chatglm2)-TTS(Vits)☆148Updated 5 months ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆285Updated 3 months ago
- 本次开源为DL-B,是一个基于ChatGLM、Wav2Lip、So-VITS组建的数字形象方案。可以在此基础之上增加其他组件达到数字生命的效果。This open source is DL-B, which is a digital image scheme based o…☆106Updated 2 years ago
- SummerAsr 是一个基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器。 Summer Asr is a Chinese automatic speech recognize project written with C++ that can be eas…☆98Updated 9 months ago
- 小智同学测试工具(websocket)☆44Updated 6 months ago
- 简单实现VAD+声纹锁+SenseVoice完成类语音实时转录的小项目☆35Updated 11 months ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆79Updated 8 months ago
- VITS2 for Chinese speech | 最新VITS2中文语音合成☆133Updated last year
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆73Updated last year
- 基于中文文本情绪分析自动切换参考音频的 GPT-SoVITS 推理 Demo☆105Updated last year
- FastAPI PaddleSpeech 音频录音转文字☆51Updated last year
- “alibabacloud-nls-python-sdk提供使用阿里云智能语音服务的能力,包括语音识别、语音合成、文件转写等。”☆66Updated 3 weeks ago
- 📣 商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide …☆582Updated last year
- 一个模块化,全过程可离线,低占用率的对话机器人/智能音箱☆104Updated 6 months ago
- 基于 faster-whisper 的伪实时语音转写服务☆226Updated 4 months ago
- chinese real time voice cloning☆38Updated 5 years ago
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆502Updated 9 months ago
- ChatTTS HTTP API☆55Updated last year
- Sample GLM4V + ChatTTS AI assistant☆85Updated last year
- 实时语音识别API WebSocket☆150Updated last year
- SenseVoice-python: A enterprise-grade open source multi-language asr system from funasr opensource with onnxruntime☆100Updated 11 months ago
- ChatGLM 6B 的模型与UI,通过 LangChain 与向量匹配实现本地知识库问答,支持流式输出☆115Updated 2 years ago
- 超快的中文普通话TTS☆121Updated 4 years ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话,本地执行功能,支持 OpenAI,Grok, Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等AP…☆37Updated 3 months ago
- 文本语料转训练集工具,txt转dataset☆93Updated last year
- 语音技术:文字转语音☆46Updated 2 years ago
- 获取bilibili直播弹幕,使用WebSocket协议☆37Updated last year
- ☆49Updated last year