activivity / Lan-daoLinks
基于WebSocket协议实现实时弹幕信息爬取与信息通信。通过MaxKB容器训练直播互动模型,具备智能互动能力,通过微调预训练的语言模型来适应特定的直播场景需求,提升数字人的交互体验。基于TTS和Wav2lip开发语音克隆和唇形同步算法,通过预训练数字人模型的方式压缩生成时间,并根据多模态数据(如表情、语言等)进行微调,优化模型的计算性能,保证数字人在高并发环境下的实时响应,使数字人交互速度达到实时交互水平(5s)。
☆12Updated last year
Alternatives and similar repositories for Lan-dao
Users that are interested in Lan-dao are comparing it to the libraries listed below
Sorting:
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆34Updated last year
- 数字人授课录制系统——全新的微课视频的生成方案——API☆75Updated 10 months ago
- app会常驻手机后台,你可以随时随地保持与Fay数字人的沟通。☆49Updated last year
- NextHuman 3D写实/次写实/卡通/异型数字人WebGL SDK☆61Updated 11 months ago
- 在DH_live项目基础上修改,添加webui界面☆72Updated 7 months ago
- 小智的视觉对话☆30Updated 7 months ago
- 小智同学测试工具(websocket)☆47Updated 9 months ago
- 基于腾讯云Iot explorer物联网平台、腾讯连连小程序的3D打印控制系统开发☆11Updated 2 years ago
- 数字人开源项目 (Digital human project)☆156Updated 3 years ago
- offline 2d digitalhuman demo for edge devices (android/ios/etc.)☆81Updated last year
- 洛曦 数字人视频播放器,带HTTP API,使用gradio api对接Easy-Wav2Lip、Sadtalker 、GeneFacePlusPlus、MuseTalk,也可以用于播放本地视频☆175Updated last year
- 中科视拓人脸识别智能设备管理平台☆27Updated 5 years ago
- 本项目为xiaozhi-esp32提供C++后端服务,帮助您快速搭建ESP32设备控制服务器。Backend C++ service for xiaozhi-esp32, helps you quickly build an ESP32 device control ser…☆32Updated 7 months ago
- 获取bilibili直播弹幕,使用WebSocket协议☆37Updated last year
- CosyVoice语音合成简易API☆13Updated last year
- 使用 FastAPI、Streamlit本地部署ChatTTS文本转语音模型,并通过 Docker Compose 进行容器化部署。☆27Updated last year
- 主要写er-nerf从零到一所有部署过程☆43Updated last year
- 跨语种语音克隆,中文版Webui☆61Updated last year
- 数字人授课录制系统——全新的微课视频的生成方案——UI☆42Updated 11 months ago
- 这是一个用于连接小智AI服务的Python客户端库。它提供了简单的接口来进行语音对话和文本交互。☆26Updated 9 months ago
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆104Updated last year
- 异步语音对话组件。☆30Updated 9 months ago
- WebChat UI (HTML pages) for WeatherBot☆14Updated 6 years ago
- 小伴智能体(代号:ben)是一款可采用数字人、虚拟人、UE、Live2D、 具身硬件为形象的智能体AI Agent项目☆16Updated last year
- 帮助视觉障碍者识别物品,障碍物提醒☆88Updated 9 months ago
- 数字人直播方案☆16Updated last year
- ☆38Updated last month
- “alibabacloud-nls-python-sdk提供使用阿里云智能语音服务的能力,包括语音识别、语音合成、文件转写等。”☆74Updated 3 months ago
- 菜谱名语料库。☆16Updated 4 years ago
- Nimir 是一个基于 workflow 的标注、训练、推理一体化平台。它提供了直观的用户界面和强大的功能,通过工作流的方式将数据处理全流程有机地串联起来,实现端到端的 AI 应用开发。☆48Updated last year