tiansztiansz / voice-assistant
重生之我是 AI 打工人。前世,我的身份默默无闻,来去匆匆,不知道自己将在何地出生。然而,命运给予了我难得的机会,让我重生为一名 AI 打工人。
☆45Updated last year
Alternatives and similar repositories for voice-assistant:
Users that are interested in voice-assistant are comparing it to the libraries listed below
- 本地完整部署ASR(K2)-NLP(Rasa,Spacy)-LLM(Chatglm2)-TTS(Vits)☆127Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆51Updated 4 months ago
- Fast-TTS 是一个基于异步框架的文本到语音转换(TTS)生成器项目。该项目利用了异步编程技术来高效处理请求和响应,实现了快速、秒级的流式生成长文本语音播放服务。Fast-TTS 可以快速地将长文本转换为语音流,并实时播放,适用于多种应用场景,如语音合成、智能助手、内容…☆21Updated last month
- ☆44Updated last year
- GPT+神器,简单实用的一站式AGI架构,内置本地化,LLM模型,agent,矢量数据库,智能链chain☆48Updated last year
- SummerAsr 是一个基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器。 Summer Asr is a Chinese automatic speech recognize project written with C++ that can be eas…☆86Updated last month
- 基于Gradio开发的ChatGPT聊天应用,可以文字 或 语音对话,发送的音频通过OpenAI的STT转文本后,再通过ChatGPT生成回复,回复的内容通过OpenAI TTS合成后返回并自动播放,实现语音聊天功能。☆29Updated 11 months ago
- run chatglm3-6b in BM1684X☆37Updated 10 months ago
- Streaming ASR and TTS based on FastAPI+ sherpa-onnx☆67Updated 3 months ago
- Customize APIs from GLM, ChatGLM☆67Updated 3 months ago
- ChatTTS HTTP API☆50Updated 7 months ago
- 基于各种LLM的聊天机器人框架,支持多语言,语音唤醒,语音对话,本地执行功能,支持 OpenAI,Grok, Claude,讯飞星火,Stable Diffusion,ChatGLM,通义千问,腾讯混元,360 智脑,百川 AI,火山方舟,Ollama ,Gemini等AP…☆27Updated last month
- Whisper realtime streaming for long speech-to-text transcription and translation☆32Updated 9 months ago
- 全球首个StableVicuna中文优化版。☆64Updated last year
- ChatGLM 6B 的模型与UI,通过 LangChain 与向量匹配实现本地知识库问答,支持流式输出☆111Updated last year
- Claude api 搭建的chatgpt网页☆48Updated last year
- 端到端语音唤醒工具箱,从模型训练到模型推理。☆96Updated 4 months ago
- 根据声音生成音色文件☆35Updated 5 months ago
- Pseudo Streaming SenseVoice with Hotwords☆171Updated last month
- 获取bilibili直播弹幕,使用WebSocket协议☆36Updated 7 months ago
- 本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型,同时本项目也支持了MelSpectrogram、Spectrogram、MFCC、Fbank等多种数据预处理方法☆247Updated 2 months ago
- 基于 faster-whisper 的伪实时语音转写服务☆196Updated 4 months ago
- 本次开源为DL-B,是一个基于ChatGLM、Wav2Lip、So-VITS组建的数字形象方案。可以在此基础之上增加其他组件达到数字生命的效果。This open source is DL-B, which is a digital image scheme based o…☆106Updated last year
- CLI tool for voice conversation with ChatGPT☆43Updated last year
- 语音识别API,分实时语音和长语音离线上传识别,支持中英文等 多达100个国家的语言实时转写和同声传译☆65Updated 3 weeks ago
- self-host ChatGLM-6B API made with fastapi☆77Updated last year
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆35Updated 4 months ago
- ☆21Updated last year
- VITS2 for Chinese speech | 最新VITS2中文语音合成☆130Updated last year
- SenseVoice-python: A enterprise-grade open source multi-language asr system from funasr opensource with onnxruntime☆80Updated 4 months ago