selfcs / stop-and-sensitive-wordsLinks
停用词和敏感词库
☆17Updated 4 years ago
Alternatives and similar repositories for stop-and-sensitive-words
Users that are interested in stop-and-sensitive-words are comparing it to the libraries listed below
Sorting:
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 企业事件抽取☆14Updated 4 years ago
- GoGPT中文指令数据集构造☆10Updated last year
- 暴恐违禁 文本色情 政治敏感 恶意推广 低俗辱骂☆98Updated 3 years ago
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated 2 years ago
- aigc evals☆10Updated last year
- deep training task☆29Updated 2 years ago
- CCKS 2022 通用信息抽取☆12Updated 3 years ago
- 基于Pytorch实现的中文文本分类脚手架,以及常用模型对比。☆18Updated 4 years ago
- GOAT(山羊)是中英文大语言模型,基于LlaMa进行SFT。☆12Updated 2 years ago
- ☆23Updated last year
- 基于simhash的文本去重算法☆20Updated 4 years ago
- 中文文本改写☆20Updated 4 years ago
- Large-scale exact string matching tool☆17Updated 3 months ago
- Baselines for CCKS 2022 Task "Product Knowledge Graph Alignment"☆30Updated 2 years ago
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文本匹配篇】☆13Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆52Updated 3 months ago
- ☆21Updated 3 years ago
- GLM (General Language Model)☆24Updated 3 years ago
- 面向金融领域的小样本跨类迁移事件抽取 第三名 方案及代码☆16Updated 4 years ago
- rasa_chinese 的服务 package☆18Updated 4 years ago
- 公安网备 敏感词过滤词☆13Updated 6 years ago
- 时间关键词正则提取以及标准化☆21Updated 3 years ago
- (NBCE)Naive Bayes-based Context Extension on ChatGLM-6b☆14Updated 2 years ago
- ☆37Updated 6 years ago
- BLOOM 模型的指令微调☆24Updated 2 years ago
- QBQTC: 大规模搜索匹配数据集☆82Updated 3 years ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆67Updated 2 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated 2 years ago
- 文本敏感词过滤(附1w+的词敏感词库)☆24Updated 5 years ago