jiangnanboy / Image_KIE_LLMLinks
利用llm大语言模型提取卡证票据关键信息。Key Information Extraction from Image with LLM(large language model).Basically, it can extract key information from all bills and documents.
☆16Updated last year
Alternatives and similar repositories for Image_KIE_LLM
Users that are interested in Image_KIE_LLM are comparing it to the libraries listed below
Sorting:
- 文档图像处理工具(Document image processing tool),包括漂白 / 文字方向矫正 / 清晰增强 / 笔记去噪美化 / 去阴影 / 扭曲矫正 / 切边增强(DocBleach / TextOrientationCorrection / DocSha…☆119Updated last year
- 修正文档扭曲/模糊/阴影等情况,使用onnx模型简单轻量部署,未来持续跟进最新最好的文档矫正方案和模型,Correct document distortion using a lightweight ONNX model for easy deployment. We wi…☆91Updated last month
- Nimir 是一个基于 workflow 的标注、训练、推理一体化平台。它提供了直观的用户界面和强大的功能,通过工作流的方式将数据处理全流程有机地串联起来,实现端到端的 AI 应用开发。☆50Updated last year
- 😆 Generate PPT by LLM follow your template. 📢 Not only use llm to generate ppt, but also according to your favorite ppt template. Just…☆98Updated last year
- OCR自动化阅卷项目☆425Updated 4 months ago
- Based on RapidOCR, extract the PDF content☆185Updated 9 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆92Updated last year
- A simple way to deploy PaddleOCR based on FastAPI. (PaddleOCR 的 FastAPI 快速部署方案)☆162Updated 4 months ago
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆124Updated 2 weeks ago
- 轻量模型的图像分析web服务,包括倾斜矫正OCR,公章(印章)检测+识别,车牌识别。api方案使用FastAPI+Gunicorn,提供gradio展示。☆102Updated last year
- 以图搜图基于Towhee(resnet50 模型) + Milvus☆74Updated last year
- 视频理解:千问视频多模态模型 & Dify☆66Updated last year
- 实现使用开源的LangFlow框架,零代码实现大模型相关应用如流量包推荐智能客服、RAG应用等,并使用两种方式将创建的工作流集成到自己的项目中☆31Updated last year
- 印章检测和印章文字识别☆22Updated last year
- 检测和提取各种场景图片中的表格区域,并纠正透视和旋转问题 Detect and extract table regions from images in various scenarios, and correct perspective and rotation i…☆117Updated last year
- 稷丰-首个开源中文农业多模态大模型☆107Updated last year
- 文档方向分类☆222Updated last week
- 识别图像中的表格+OCR识别☆25Updated last year
- Analysis of Chinese and English layouts 中英文版面分析☆260Updated this week
- 研究GOT-OCR-项目落地加速,不限语言☆62Updated last year
- virtualwife-llm-factory 是一个llm训练框架,用于解决虚拟角色训练入门门槛高的问题,该框架具备自动生成语料,性格塑造评估,基于国产llm微调训练等核心能力,目前还在开发,可以点个star~ 关注一下☆50Updated 7 months ago
- ☆26Updated last year
- 检测透视图像中的矩形文档并对其进行矫正☆31Updated 3 years ago
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆131Updated 3 years ago
- MinerU API server☆85Updated last year
- 基于电商数据微调的Qwen2.5系列的电商大模型,电商数据sft后电商大模型。是https://github.com/leeguandong/EcommerceLLM的升级版本。qwen2.5的效果很好。☆13Updated last year
- DeepParseX 是一个强大的多模态文档解析与知识管理平台,支持 PDF、Word、Excel、PPT、图片、视频、音频 等多种文 件格式的智能解析,自动提取关键信息,并构建 检索增强生成(RAG) 和 知识图谱(Knowledge Graph) 系统,实现结构化数据的智…☆56Updated this week
- 基于LangGraph开发的智能体项目,可借助大模型自动调用工具规划旅游行程,包括景点搜索、交通查询、饭店酒店查询等功能☆40Updated last year
- 在本项目中使用Haystack框架实现模拟健康档案私有知识库构建和检索全流程,通过一份代码实现了同时支持多种大模型(如OpenAI、阿里通义千问等)的RAG(检索增强生成)功能:(1)离线步骤:文档加载->文档切分->向量化->灌入向量数据库;在线步骤:获取用户问题->用户…☆34Updated last year
- 一个基于多模态向量模型及视觉多模态模型构建的图片搜索引擎&管理系统,实现精准的以文搜文,文搜图、以图搜图多种智能检索方式。An image search engine management system built upon multimodal vector models…☆77Updated 4 months ago