selfcs / stop-and-sensitive-wordsLinks
停用词和敏感词库
☆17Updated 4 years ago
Alternatives and similar repositories for stop-and-sensitive-words
Users that are interested in stop-and-sensitive-words are comparing it to the libraries listed below
Sorting:
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分 析、数据挖掘、数据分析☆53Updated 7 months ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆16Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆171Updated 4 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆51Updated 3 years ago
- 百度QA100万数据集☆48Updated last year
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated 2 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆129Updated 2 years ago
- 中文关键词提取☆14Updated 2 years ago
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调 和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated 2 years ago
- ☆22Updated 3 years ago
- 打造人人都会的NLP,开源不易,记得star哦☆101Updated 2 years ago
- 大语言模型训练和服务调研☆36Updated 2 years ago
- 大规模中文语料☆44Updated 5 years ago
- PersonGraphDataSet, nearly 10 thousand person2person relationship facts。 人物图谱数据集,近十万的人物关系图谱事实数据库,通过人物关系抽取算法抽取+人工整理得出,可用于人物关系搜索、 查询、人物关系多跳问…☆253Updated 4 years ago
- 实现一种多Lora权值集成切换+Zero-Finetune零微调增强的跨模型技术方案,LLM-Base+LLM-X+Alpaca,初期,LLM-Base为Chatglm6B底座模型,LLM-X是LLAMA增强模型。该方案简易高效,目标是使此类语言模型能够低能耗广泛部署,并最…☆117Updated 2 years ago
- 百度百科爬虫☆33Updated 5 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated 2 years ago
- 一个基于预训练的句向量生成工具☆137Updated 2 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆30Updated last year
- 时间抽取、解析、标准化工具☆55Updated 2 years ago
- ☆23Updated 2 years ago
- 中文语料库-每日自动更新版 ── 语料文件☆160Updated 4 years ago
- 文本智能校对大赛(Chinese Text Correction)的baseline☆68Updated 3 years ago
- 中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/☆91Updated 7 months ago
- Baselines for CCKS 2022 Task "Product Knowledge Graph Alignment"☆30Updated 2 years ago
- 百度百科 500 万数据集☆42Updated last year
- 基于sentence-transformers实现文本转向量的机器人☆46Updated 3 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆36Updated 4 years ago
- QBQTC: 大规模搜索匹配数据集☆83Updated 3 years ago
- Tracking the hot Github repos and update daily 每天自动追踪Github热门项目☆49Updated this week