JokingXie / meeting-minutesLinks
基于语音识别和自然语言处理技术,自动完成会议录音的说话人分离、内容转译,并智能生成会议纪要。
☆19Updated 2 months ago
Alternatives and similar repositories for meeting-minutes
Users that are interested in meeting-minutes are comparing it to the libraries listed below
Sorting:
- Programming with local large language model.☆22Updated 2 weeks ago
- 模型 llava-Qwen2-7B-Instruct-Chinese-CLIP 增强中文文字识别能力和表情包内涵识别能力,接近gpt4o、claude-3.5-sonnet的识别水平!☆24Updated last year
- 文本语料转训练集工具,txt转dataset☆94Updated last year
- 基于ultralytics训练的行人跌倒检测模型☆18Updated 2 years ago
- DH-Live-Web-UI☆18Updated last year
- 集成了LLM与SDXL的AIGC应用程序☆29Updated last year
- 研究GOT-OCR-项目落地加速,不限语言☆62Updated 11 months ago
- Just a suturing monster project.☆41Updated last year
- 读光中英文OCR onnx 版本模型使用 | Code for using the ONNX version of DuGuang OCR in both Chinese and English☆46Updated 4 months ago
- 视频理解:千问视频多模态模型 & Dify☆64Updated last year
- VideoFinder is an advanced video analysis tool powered by multimodal AI, designed to help users easily locate and identify specific objec…☆162Updated 10 months ago
- This project provides a production-ready, real-time inference server for LatentSync, enabling high-quality, low-latency 2D digital human …☆17Updated last month
- Qwen 提示词工程 & 最佳实践☆33Updated last year
- 基于Linly-Talker数字人改版的教育系统,包含网课总结、数字人对话、Chatbot对话,项目可在autodl部署☆33Updated last year
- 使用FastAPI+vLLM部署Qwen2.5☆22Updated 11 months ago
- 在DH_live项目基础上修改,添加webui界面☆66Updated 5 months ago
- 通过此代码可以免训练模型并通过轻量级服务器定制数字人形象☆105Updated last year
- Sample GLM4V + ChatTTS AI assistant☆85Updated last year
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆180Updated 2 months ago
- 该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作☆60Updated last year
- 数字人授课录制系统——全新的微课视频的生成方案——API☆64Updated 8 months ago
- 使用 FastAPI、Streamlit本地部署ChatTTS文本转语音模型,并通过 Docker Compose 进行容器化部署。☆27Updated 11 months ago
- python库,实现推送实时rtmp音视频流☆131Updated last year
- ☆27Updated 11 months ago
- 📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。☆205Updated 10 months ago
- 基于通义千问 Qwen2.5-Omni 的实时语音对话系统,使用在线API服务,支持实时语音交互、动态语音活动检测和流式音频处理。A real-time voice conversation system based on Qwen2.5-Omni Online-API, …☆71Updated 4 months ago
- 主要写er-nerf从零到一所有部署过程☆43Updated last year
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆63Updated this week
- ☆42Updated last year
- 异步语音对话组件。☆26Updated 6 months ago