yanghan-cyber / audio-serviceLinks
基于FastAPI的语音服务系统,集成语音合成(TTS)和语音识别(STT)功能。使用CosyVoice2作为TTS引擎,FunASR作为STT引擎,支持零样本语音克隆、流式输出、多种语言识别等高级功能。
☆11Updated 3 months ago
Alternatives and similar repositories for audio-service
Users that are interested in audio-service are comparing it to the libraries listed below
Sorting:
- 基于大模型生成内容的智能语音对讲☆10Updated 8 months ago
- mcp的webui界面,支持客户端连接多个sse服务端,支持 openai、deepseek、qwen等大模型,另外附上构建的 agent的 stdio和sse的简单 天气查询的完整示例☆32Updated last month
- 异步语音对话组件。☆24Updated 4 months ago
- Text2Neo4j 是一个遍历文档、从文本中提取关系并将其保存到 Neo4j 数据库中以形成知识图谱的工具。本项目结合了 Dify 和 LLaMA3.1(8B 模型)来高效处理和提取复杂关系。☆19Updated 10 months ago
- A simple WeChat Official Account layout tool based on Dify☆17Updated 3 weeks ago
- 对接 Dify不同应用的 API,从而对接自己的业务系统,实现与 Dify 应用的对话流处理,将对话结果流式返回给前端,并将对话结果分发给开发者自行处理☆11Updated 10 months ago
- 一个用于BiliBili网站实时热点&舆情分析的AI 智能体☆73Updated 7 months ago
- 基于 KouriChat 的 Dify 集成情感陪伴机器人,支持微信,增强 AI 交互。☆24Updated 4 months ago
- ubuntu 系统下 GLM-4-Voice 部署经验分享☆19Updated 8 months ago
- 如何让 dify工作流的 code 节点拿到图片的信息☆24Updated 4 months ago
- ☆10Updated 3 weeks ago
- 通过装饰器将函数接入OpenAI的Chat☆47Updated 4 months ago
- Examples for QinYan GLMs☆13Updated 10 months ago
- AI驱动的技术面试模拟平台,帮助开发者准备技术面试。提供智能面试官模拟、多种技术岗位覆盖、即时反馈和表现分析。☆30Updated 4 months ago
- This Python package provides a convenient and powerful interface to interact with the Dify API, enabling developers to integrate a wide r…☆44Updated 5 months ago
- funasr语音转文字的简单api版本,funasr+fastapi,方便部署在服务器上☆12Updated 11 months ago
- 将Wav2Lip和GFPGAN进行结合实现高清数字人说话视频☆32Updated last month
- An AI-powered content conversion tool that transforms text, web content, or HTML code into beautifully designed card images.一款基于AI的内容转换工…☆26Updated 3 months ago
- 基于Qwen2+SFT+DPO的医疗问答系统,项目中使用了LLaMA-Factory用于训练,fastllm和vllm用于推理,☆14Updated last week
- 本项目借助飞桨平台,构建起一套创新的多模型协同系统,实现 PDF 文件到 Markdown 文件的高效、精准转换。☆20Updated 3 months ago
- ☆8Updated 10 months ago
- 基于GLM4-Chat实现本地知识库查询以及Agent☆7Updated last year
- 基于知识图谱和大模型的对话系统☆10Updated 2 months ago
- ☆33Updated last year
- 本项目系列相关视频为大家测试CrewAI官方提供的Tools☆11Updated 6 months ago
- ☆11Updated last month
- 语音识别、文本转语音、文档重排和数据库连接的一键式API服务☆34Updated 3 weeks ago
- LLM智能路由网关、 Enterprise Intelligent AI-API Distribution Gateway☆12Updated 5 months ago
- Dify优质应用模板☆40Updated 8 months ago
- 集成Qwen与DeepSeek等先进大语言模型,支持纯LLM+分类层模式及LLM+LoRA+分类层模式,使用transformers模块化设计和训练便于根据需要调整或替换组件。☆11Updated 3 months ago