zhangleino1 / vision_describeLinks
这是一个基于FastAPI的智能视频识别系统,集成了Ollama大模型,能够实时处理RTSP视频流并提供AI驱动的内容识别功能。系统采用现代化的Web界面设计,支持多终端访问,为视频监控和内容分析提供了强大的解决方案。
☆33Updated 5 months ago
Alternatives and similar repositories for vision_describe
Users that are interested in vision_describe are comparing it to the libraries listed below
Sorting:
- 基于大模型的视频监控危险行为检测系统,集成YOLOv8、GPT-4V等视觉和多模态AI模型,提供高精度危险行为识别、场景理解和智能告警分析。☆137Updated 8 months ago
- ☆416Updated last week
- 由 Dify API 驱动的前沿桌面智能对话应用,具备企业级人工智能对话能力。这款应用拥有主题定制、知识库管理以及多场景应用等显著功能。 如今,我们进行了重大升级,新增对 OpenAI 格式输出的支持。这意味着,它能够与市面上所有遵循 OpenAI 格式的人工智能模型无缝…☆268Updated 8 months ago
- xclabel是一款支持多人协作的,样本导入+样本标注+模型训练+模型管理+模型测试+模型导出的工具☆181Updated 2 weeks ago
- 为AI带路党Pro视频准备☆276Updated 9 months ago
- A code executor for Dify that is compatible with the official sandbox API calls and dependency installation.☆366Updated 7 months ago
- ragflow中的ocr部分,非官方项目☆52Updated last year
- 天枢 - 企业级 AI 一站式数据预处理平台 | PDF/Office转Markdown | 支持MCP协议AI助手集成 | Vue3+FastAPI全栈方案 | 文档解析 | 多模态信息提取☆196Updated this week
- ☆27Updated 8 months ago
- 一个将 Dify 应用程序转换为 OpenAI API 接口的网关服务,使您可以使用 OpenAI API 兼容的方式访问 Dify 的 LLM、知识库、工具和工作流程。☆205Updated 6 months ago
- Unsloth框架在Windows平台微调训练Qwen2大模型,非WSL☆62Updated last year
- 模版式PPT,可以生成套用模版的PPT☆279Updated this week
- 自动批量上传并解析文档至 RagFlow 知识库,省去手动操作,提升效率。☆473Updated 4 months ago
- dify框架对接ragflow外部知识库代理服务☆31Updated 9 months ago
- 基于Vue 3和TypeScript构建的智能搜索对话应用前端项目,后端通过Dify工作流编排的对话型应用提供API支持。☆111Updated 9 months ago
- ☆273Updated 11 months ago
- 构建一个基于大模型的智能客服系统,可提供静态知识问答(静态数据)、动态知识问答(数据库),业务办理(api调用)等功能,同时系统具有自我学习能力。定期的反思可让系统变得更强大。☆77Updated last month
- mcp的webui界面,支持客户端连接多个sse服务端,支持 openai、deepseek、qwen等大模型,另外附上构建的 agent的 stdio和sse的简单 天气查询的完整示例☆37Updated 6 months ago
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆75Updated 2 months ago
- Ai-To-PPTX Backend PHP >=7.4 + Redis☆116Updated 10 months ago
- 数字人授课录制系统——全新的微课视频的生成方案——API☆75Updated 10 months ago
- 标书大模型(Proposal-LLM Chinese version )☆296Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆104Updated last year
- ☆302Updated 9 months ago
- 使用CrewAI+FastAPI搭建多Agent协作应用并对外提供API服务,同时支持gpt、国产大模型、Ollama本地大模型。☆167Updated last year
- Convert files into markdown to help RAG or LLM understand, based on markitdown and MinerU, which could provide high quality pdf parser.☆130Updated 8 months ago
- 一个 Dify 应用管理平台,基于 Dify API 构建,提供深度优化的用户端交互界面,支持 Chatflow、Workflow 等多种 Dify 应用类型,适配深度思考、思维链、图表渲染、文件处理等丰富的 AI 输出形式,提供开箱即用的 AI 应用解决方案。☆666Updated last week
- 基于SpringBoot+Docker+Cuda+Cudnn+Pythorch+Onnx+Tensorrt+Yolov8+ffmpeg+zlmediakit 的AI算法中台系统,本系统主要实现JAVA调用Python脚本的方式,实现在英伟达GPU上进行yolov8的onnx…☆153Updated 5 months ago
- 本项目主要实现使用FastAPI后端框架+CrewAI实现AI Agent复杂工作流。代码实现CrewAI的Flows功能,并支持Flow运行中间结果进行持久化存储和查询(MySQL),支持多Flow并行(Celery是一个强大的异步任务队列/作业队列库)。☆110Updated 8 months ago
- 😆 Generate PPT by LLM follow your template. 📢 Not only use llm to generate ppt, but also according to your favorite ppt template. Just…☆94Updated last year