selfcs / stop-and-sensitive-words
停用词和敏感词库
☆15Updated 4 years ago
Alternatives and similar repositories for stop-and-sensitive-words:
Users that are interested in stop-and-sensitive-words are comparing it to the libraries listed below
- GOAT(山羊)是中英文大语言模型,基于LlaMa进行SFT。☆12Updated last year
- BLOOM 模型的指令微调☆24Updated last year
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- ☆20Updated 2 years ago
- GLM (General Language Model)☆24Updated 2 years ago
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文本匹配篇】☆11Updated 2 years ago
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆54Updated last year
- 用Paddle复现论文ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information(ACL2021)☆9Updated 3 years ago
- Reached new sota on wikikg2☆9Updated 2 years ago
- CCKS 2022 通用信息抽取☆12Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取 、研究热点分析、数据挖掘、数据分析☆46Updated last month
- aigc evals☆10Updated last year
- ☆40Updated 10 months ago
- ☆24Updated last year
- TensorRT☆11Updated 4 years ago
- ☆21Updated 6 months ago
- 基于Pytorch实现的中文文本分类脚手架,以及常用模型对比。☆18Updated 3 years ago
- GoGPT中文指令数据集构造☆10Updated 11 months ago
- ☆23Updated last year
- deep training task☆29Updated last year
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆48Updated 2 years ago
- 法研杯犯罪金额提取☆12Updated 2 years ago
- 基于simhash的文本去重算法☆20Updated 3 years ago
- moss chat finetuning☆50Updated 8 months ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆65Updated 2 years ago
- 基于seq2edit (Gector) 的中文文本纠错。☆27Updated 2 years ago
- 汉语框架语义解析☆17Updated last year
- 大语言模型ChatGLM-6B为基座,接入文档阅读功能进行实时问答,可上传txt/docx/pdf 多种文件类型。☆38Updated last year
- 有一个通用实体关系事件抽取的任务,需要使用到UIE模框架,而且需要将起部署到昇腾310服务器上,因为UIE模型底层使用的是ernie3.0,但是目前paddle官方还不支持ernie3.0模型在昇腾310上部署,所以才有了以下的操作,主要过程是,先试用paddle训练处模型…☆17Updated 2 years ago