hchhtc123 / WebCscSystemLinks
基于PaddlePaddle的Web端多格式纠错系统,前后端分离式部署,支持文本、文档及图片的多格式智能纠错!同时支持对修正的错误字进行标记提示和结果的保存。 技术栈:后端:FastAPI + PaddleNLP + PaddleHub;前端:Vue+ ElementUI。
☆19Updated 3 years ago
Alternatives and similar repositories for WebCscSystem
Users that are interested in WebCscSystem are comparing it to the libraries listed below
Sorting:
- 飞桨常规赛:中文新闻文本标题分类9月第1名方案,分数0.9+,基于PaddleNLP通过预训练模型的微调完成新闻14分类模型的训练与优化☆19Updated 3 years ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆35Updated last year
- Datawhale自研数据标注工具☆70Updated last year
- 2021软件杯-新闻智分系统项目开源,基于PaddleHub通过预训练模型ERNIE-Tiny在整合与爬取的新闻10分类数据集上进行微调完成模型训练,可实现精细的新闻长文本10分类任务。最后基于PyQt5完成GUI可视化界面开发以及基于VUE+FastAPI完成该项目的we…☆25Updated 3 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆115Updated last year
- 该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit☆17Updated 2 years ago
- 本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的☆67Updated 5 years ago
- All NLP you Need Here. 目前包含15个NLP demo的pytorch实现(大量代码借鉴于其他开源项目,原先是自己玩的,后来干脆也开源出来)☆288Updated last week
- 山东省第二届数据应用创新创业大赛-主赛场-检验报告单识别-Baseline☆14Updated 4 years ago
- PaddleOCR 输出结果的行对齐,表格制式图像OCR行对齐☆47Updated 3 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- 中国 知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 6 months ago
- 中文文本相似度计算器☆158Updated 11 months ago
- A training and inference framework for open ner and re models! 信息抽取(实体抽取、关系抽取、事件抽取)模型的统一训练和推理框架,包含丰富的开源SOTA模型☆12Updated 8 months ago
- 利用指针网络进行信息抽取,包含命名实体识别、关系抽取、事件抽取。☆129Updated 2 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆67Updated 4 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆56Updated 5 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆75Updated 7 months ago
- 文本自动摘要☆93Updated 2 years ago
- 一个短视频app文本审核模块的实现思路及demo☆122Updated 7 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆127Updated 2 years ago
- 🌞 CareLlama (关怀羊驼)是一个医疗大语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型以促进医疗LLM快速发展。Medical LLM, Open Source Driven for a Healthy Future.☆41Updated 2 years ago
- 该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长 度的文本切分和滑窗操作☆57Updated 11 months ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆65Updated 4 years ago
- 基于PaddleX+Flask开发后端,基于VUE开发前端应用,做一个AI医疗的WEB应用☆177Updated 4 years ago
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆41Updated 3 years ago
- 使用bert进行事件抽取。☆47Updated 2 years ago
- FAQ智能问答系统。实现FAQ的问题-模板匹配功能。部署轻量级的Web服务应用。☆63Updated last year
- 基于Bilstm + CRF的信息抽取模型☆36Updated 4 years ago
- 使用LoRA对ChatGLM进行微调。☆49Updated 2 years ago