tiansztiansz / voice-assistant
重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。
☆46Updated last year
Alternatives and similar repositories for voice-assistant:
Users that are interested in voice-assistant are comparing it to the libraries listed below
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆61Updated 6 months ago
- ChatTTS HTTP API☆52Updated 8 months ago
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话,本地执行功能,支持 OpenAI,Grok, Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等AP…☆28Updated 3 weeks ago
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- 本地完整部署ASR(K2)-NLP(Rasa,Spacy)-LLM(Chatglm2)-TTS(Vits)☆129Updated last year
- SummerAsr 是一个基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器。 Summer Asr is a Chinese automatic speech recognize project written with C++ that can be eas…☆87Updated 2 months ago
- Sample GLM4V + ChatTTS AI assistant☆85Updated 8 months ago
- Pseudo Streaming SenseVoice with Hotwords☆200Updated this week
- 基于Gradio开发的ChatGPT聊天应用,可以文字 或 语音对话,发送的音频通过OpenAI的STT转文本后,再通过ChatGPT生成回复,回复的内容通过OpenAI TTS合成后返回并自动播放,实现语音聊天功能。☆33Updated last year
- 基于 faster-whisper 的伪实时语音转写服务☆202Updated 5 months ago
- “alibabacloud-nls-python-sdk提供使用阿里云智能语音服务的能力,包括语音识别、语音合成、文件转写等。”☆43Updated 3 months ago
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等多达100个国家的语言实时转写和同声传译☆68Updated 2 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆43Updated 5 months ago
- 基于中文文本情绪分析自动切换参考音频的 GPT-SoVITS 推理 Demo☆93Updated 11 months ago
- ☆46Updated last year
- 端到端语音唤醒工具箱,从模型训练到模型推理。☆105Updated 5 months ago
- self-host ChatGLM-6B API made with fastapi☆78Updated last year
- run chatglm3-6b in BM1684X☆38Updated last year
- 用于SenseVoice的api项目,输出带时间戳字幕☆28Updated 4 months ago
- 基于ChatGLM2带的openai_api.py修改支持ChatGLM3。☆20Updated last year
- 通过 此代码可以免训练模型并通过轻量级服务器定制数字人形象☆102Updated 11 months ago
- 本次开源为DL-B,是一个基于ChatGLM、Wav2Lip、So-VITS组建的数字形象方案。可以在此基础之上增加其他组件达到数字生命的效果。This open source is DL-B, which is a digital image scheme based o…☆106Updated last year
- TianMu: A modern AI tool with multi-platform support, markdown support, multimodal, continuous conversation, and customizable commands. 一…☆83Updated last year
- 获取bilibili直播弹幕,使用WebSocket协议☆36Updated 8 months ago
- 🤗【欧小鹏】辅助社区运营,支持文生图、闲聊等群活跃技能,以及社群自动问答等辅助管理功能。☆61Updated last year
- 微信机器人,接入 ChatGPT、讯飞星火、Tigerbot。☆35Updated last year
- Documentation for Bert-VITS2☆22Updated last year
- ASRT语音识别系统的Python版SDK☆51Updated 2 years ago
- SenseVoice-python: A enterprise-grade open source multi-language asr system from funasr opensource with onnxruntime☆83Updated 5 months ago