hchhtc123 / WebCscSystemLinks
基于PaddlePaddle的Web端多格式纠错系统,前后端分离式部署,支持文本、文档及图片的多格式智能纠错!同时支持对修正的错误字进行标记提示和结果的保存。 技术栈:后端:FastAPI + PaddleNLP + PaddleHub;前端:Vue+ ElementUI。
☆18Updated 3 years ago
Alternatives and similar repositories for WebCscSystem
Users that are interested in WebCscSystem are comparing it to the libraries listed below
Sorting:
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated 11 months ago
- Datawhale自研数据标注工具☆68Updated last year
- 山东省第二届数据应用创新创业大赛-主赛场-检验报告单识别-Baseline☆13Updated 4 years ago
- 2021软件杯-新闻智分系统项目开源,基于PaddleHub通过预训练模型ERNIE-Tiny在整合与爬取的新闻10分类数据集上进行微调完成模型训练,可实现精细的新闻长文本10分类任务。最后基于PyQt5完成GUI可视化界面开发以及基于VUE+FastAPI完成该项目的we…☆25Updated 3 years ago
- t5-model-onnx,中文拼写纠错,Chinese spelling correction。☆14Updated 2 years ago
- 本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。☆29Updated 3 months ago
- A training and inference framework for open ner and re models! 信息抽取(实体抽取、关系抽取、事件抽取)模型的统一训练和推理框架,包含丰富的开源SOTA模型☆12Updated 5 months ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆113Updated 11 months ago
- 飞桨常规赛:中文新闻文本标题分类9月第1名方案,分数0.9+,基于PaddleNLP通过预训练模型的微调完成新闻14分类模型的训练与优化☆19Updated 3 years ago
- 该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit☆18Updated 2 years ago
- 使用Qwen1.5-0.5B-Chat模型进行通用信息抽取任务的微调,旨在: 验证生成式方法相较于抽取式NER的效果; 为新手提供简易的模型微调流程,尽量减少代码量; 大模型训练的数据格式处理。☆12Updated 9 months ago
- PaddleOCR 输出结果的行对齐,表格制式图像OCR行对齐☆44Updated 3 years ago
- pytorch+bert实现的意图识别与槽位填充☆11Updated 2 years ago
- 基于百度ERNIE和Pycorrector的文本编辑和批改的软件☆25Updated 3 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆23Updated 2 years ago
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆23Updated 2 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆73Updated 5 months ago
- 基于PaddleNLP的web端文本纠错系统,支持输入文本或上传word文档,显示纠错后文本结果与保存。 技术栈:后端:PaddleNLP +FastAPI;前端:Vue+Element UI☆12Updated 3 years ago
- 一站式自动化开源标注平台☆73Updated 2 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆56Updated 5 years ago
- Label Studio is a multi-type data labeling and annotation tool with standardized output format☆9Updated 3 years ago
- 大模型预训练中文语料清洗及质量评估 Large model pre-training corpus cleaning☆65Updated 11 months ago
- chinese document classification of layoutlmv3 and layoutxlm☆43Updated 2 years ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆63Updated 4 years ago
- BLOOM 模型的指令微调☆24Updated 2 years ago
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- Code & Data for our Paper "NaSGEC: Multi-Domain Chinese Grammatical Error Correction for Native Speaker Texts" (ACL 2023 Findings)☆89Updated 4 months ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆52Updated 3 months ago
- Recognition of Various Common Seal Scans in Complex Environments☆47Updated last year