SunLinJie / Text_Review
本项目旨在识别长短文本中的敏感词,并对整段/句文本进行语义分类,从而达到文本审核的目的
☆64Updated 5 years ago
Alternatives and similar repositories for Text_Review:
Users that are interested in Text_Review are comparing it to the libraries listed below
- 基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名…☆54Updated last year
- DFA 实现中文敏感词检测☆99Updated 2 years ago
- 一个短视频app文本审核模块的实现思路及demo☆117Updated 6 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆118Updated last year
- text security audit 安全审核-语义模型过滤 敏感内容检测系统☆22Updated 2 months ago
- ChatGLM-6B fine-tuning.☆135Updated last year
- The official repository of the paper: COLD: A Benchmark for Chinese Offensive Language Detection☆263Updated 2 years ago
- chatglm3base模型的有监督微调SFT☆74Updated last year
- 基于sentence transformers和chatglm实现的文档搜索工具☆154Updated 2 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 4 months ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 5 months ago
- 2022字节跳动安全AI挑战赛赛道一冠军—— 基于文本和多模态数据的风险识别 题目名称:Emoji复杂文本识别☆13Updated 2 years ago
- ☆77Updated last year
- 基于chatglm快速搭建文档问答机器人☆88Updated last year
- chatglm-6B for tools application using langchain☆75Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆49Updated last month
- 多显卡部署版 | ChatGLM-6B:开源双语对话语言模型 | An Open Bilingual Dialogue Language Model☆62Updated 2 years ago
- 中文文本相似度计算器☆142Updated 6 months ago
- 一个用于训练句子embedding的工具,支持Cosent以及Simcse☆18Updated 5 months ago
- 基于ChatGPT构建的中文self-instruct数据集☆116Updated last year
- 通过机器学习进行敏感词的识别☆28Updated 7 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆233Updated last year
- 一个基于预训练的句向量生成工具☆137Updated 2 years ago
- kbqa,langchain,large langauge model, chatgpt☆80Updated 6 months ago
- 基于 BERT 模型的中文文本分类工具☆64Updated 3 years ago
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆67Updated 5 years ago
- MuCGEC中文纠错数据集及文本纠错SOTA模型开源;Code & Data for our NAACL 2022 Paper "MuCGEC: a Multi-Reference Multi-Source Evaluation Dataset for Chinese Gr…☆535Updated last year
- PaddleOCR 输出结果的行对齐,表格制式图像OCR行对齐☆44Updated 3 years ago
- 新闻标题摘要生成模型,基于T5-PEGASUS。News title summary generation model☆18Updated 2 years ago
- 中文聊天小模型,用t5 base在大量数据上有监督。☆101Updated last year