SSFRPA / SpeakControlLinks
SpeakControl 是基于ssfrpa开发的可自定义任意指令的语音控制,指令可以是简单的运行某程序、也可以是复杂流程逻辑。
☆18Updated 6 months ago
Alternatives and similar repositories for SpeakControl
Users that are interested in SpeakControl are comparing it to the libraries listed below
Sorting:
- openai chatgpt or local llm(llama.cpp gguf format)+TTS+STT+Word+Excel☆101Updated last year
- 小智机器人服务端☆18Updated 10 months ago
- ☆28Updated 9 months ago
- (整合包Integrated package)一键使用面壁智能最新的MiniCPM-o 2.6多模态模型,用于视频对话、语音对话和文字对话。|Use Modelbest's latest MiniCPM-o 2.6 multi-modal model with one c…☆15Updated 6 months ago
- YOLO样本标注工具,AI自动标注,大模型提示词自动标注,自动采集视频,自动收集数据集☆215Updated last month
- 基于ultralytics训练的行人跌倒检测模型☆19Updated 2 years ago
- ☆25Updated 10 months ago
- vibe coding 一天搓出来的利用nano创作PPT的小工具。☆43Updated this week
- 本项目基于RuoYi-Vue框架为xiaozhi-esp32提供Java后端聊天服务器。帮助个人、企业快速部署的xiaozhi-esp32后端服务。☆21Updated 7 months ago
- CosyVoice语音合成简易API☆14Updated last year
- 数字人授课录制系统——全新的微课视频的生成方案——UI☆44Updated last year
- embedding vector agent☆178Updated last week
- 文本语料转训练集工具,txt转dataset☆93Updated last year
- Fastllm-based chatbot☆11Updated 2 years ago
- AI虚拟伙伴Linux版☆123Updated 2 weeks ago
- vllm混合推理扩展插件,支持多NUMA混合推理,单卡推理Qwen3-Next模型可达1000+ prefill☆31Updated 3 months ago
- combine ASR, LLM and TTS in local development with python☆16Updated last year
- Inference SAM in C # based on OpenVINO, ONNX runtime, TensorRT☆17Updated last year
- VideoFinder is an advanced video analysis tool powered by multimodal AI, designed to help users easily locate and identify specific objec…☆169Updated last year
- segment anything(SAM) WPF客户端☆57Updated last year
- ☆13Updated 5 months ago
- 基于大模型的视频监控危险行为检测系统,集成YOLOv8、GPT-4V等视觉和多模态AI模型,提供高精度危险行为识别、场景理解和智能告警分析。☆156Updated 10 months ago
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆77Updated 4 months ago
- 基于youtube、bilibili等视频平台、webpage网页等,利用零一万物大模型或ollama本地小模型构建大语言模型高质量训练数据集(计划支持可自定义输出的训练数据格式)☆19Updated last year
- 友伴(YouBand)是一款轻量、易用、跨平台的"LLM聊天机器人"桌面程序。支持QQ、微信、飞书等应用,可自由切换DeepSeek、Ollama、Qwen等大模型。让您的应用成为24小时待命的私人助理,用AI重新定义您的工作效率与生活体验。☆103Updated 9 months ago
- 基于FunASR官方Demo修改的WS服务端,配合FastAPI提供HTTP服务,可以在浏览器中进行实时ASR测试☆46Updated 6 months ago
- AI桌宠2.2(网页端toklen白嫖国产大模型服务器(glm4,kimi,deepseekv2),语音识别,屏幕识别自动发送,live2d 2.0和3.0模型,gpt-sovits语音,coysvoice语音,edge-tts语音(支持多语言音色),本地ollama模型无…☆186Updated last year
- EIVideo- 交互式智能视频标注工具,几次鼠标点击即可解放双手,让视频标注更加轻松☆32Updated 3 years ago
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆104Updated last year
- ☆26Updated last year