tiansztiansz / voice-assistantLinks
重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。
☆48Updated 2 years ago
Alternatives and similar repositories for voice-assistant
Users that are interested in voice-assistant are comparing it to the libraries listed below
Sorting:
- 本地完整部署ASR(K2)-NLP(Rasa,Spacy)-LLM(Chatglm2)-TTS(Vits)☆143Updated 3 months ago
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆90Updated 10 months ago
- 本次开源为DL-B,是一个基于ChatGLM、Wav2Lip、So-VITS组建的数字形象方案。可以在此基础之上增加其他组件达到数字生命的效果。This open source is DL-B, which is a digital image scheme based o…☆106Updated 2 years ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆67Updated 10 months ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- SummerAsr 是一个基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器。 Summer Asr is a Chinese automatic speech recognize project written with C++ that can be eas…☆95Updated 7 months ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆273Updated last month
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话,本地执行功能,支持 OpenAI,Grok, Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等AP…☆32Updated last month
- 洛曦 数字人视频播放器,带HTTP API,使用gradio api对接Easy-Wav2Lip、Sadtalker、GeneFacePlusPlus、MuseTalk,也可以用于播放本地视频☆167Updated 8 months ago
- 实时语音识别API WebSocket☆145Updated 11 months ago
- 基于中文文本情绪分析自动切换参考音频的 GPT-SoVITS 推理 Demo☆103Updated last year
- VITS2 for Chinese speech | 最新VITS2中文语音合成☆134Updated last year
- 适配windows的requirements.txt,加了个长文本分段推理和手机听书的api,非本专业,屎山代码☆37Updated last year
- FastAPI PaddleSpeech 音频录音转文字☆50Updated last year
- self-host ChatGLM-6B API made with fastapi☆78Updated 2 years ago
- 基于 faster-whisper 的伪实时语音转写服务☆219Updated 2 months ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆79Updated 6 months ago
- SenseVoice-python: A enterprise-grade open source multi-language asr system from funasr opensource with onnxruntime☆96Updated 9 months ago
- 📣 商用级开源语音自动识别程序库,开箱即用,全平台支持,中英文混合识别。A Cross-platform implementation of ASR inference. It's based on ONNXRuntime and FunASR. We provide …☆563Updated last year
- 小智同学测试工具(websocket)☆43Updated 4 months ago
- “alibabacloud-nls-python-sdk提供使用阿里云智能语音服务的能力,包括语音识别、语音合成、文件转写等。”☆60Updated last month
- 🤗【欧小鹏】辅助社区运营,支持文生图、闲聊等群活跃技能,以及社群自动问答等辅助管理功能。☆62Updated last year
- ChatGLM 6B 的模型与UI,通过 LangChain 与向量匹配实现本地知识库问答,支持流式输出☆113Updated 2 years ago
- ChatTTS HTTP API☆55Updated last year
- 获取bilibili直播弹幕,使用WebSocket协议☆36Updated last year
- 语音技术:文字转语音☆45Updated 2 years ago
- 从langchain-ChatGLM基础上修改的一个可以加载TigerBot模型的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。☆107Updated last year
- 《数字生命》启动器☆98Updated 2 years ago
- 通过此代码可以免训练模型并通过轻量级服务器定制数字人形象☆105Updated last year
- 实时STT,连接OpenAI接口/智谱AI(流式LLM)和GPT-SOVITS/Edge-TTS,通过网页的方式,进行跨网络的服务调用,实现实时对话的效果☆400Updated 6 months ago