JiangYanting / Word_list_dataset_terminology
术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习
☆26Updated 4 years ago
Alternatives and similar repositories for Word_list_dataset_terminology:
Users that are interested in Word_list_dataset_terminology are comparing it to the libraries listed below
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆215Updated 6 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆274Updated last year
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆112Updated 4 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆124Updated 6 years ago
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- Sequential Event Experiment based on Travel note crawled from XieCheng,基于50W携程出行游记的采集与顺承事件图谱构建.☆181Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆152Updated 3 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆96Updated 6 years ago
- Event monitor based on online news corpus including event storyline and analysis,基于给定事件关键词,采集事件资讯,对事件进行挖掘和分析。☆152Updated 6 years ago
- TextClf :基于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆237Updated last year
- NER(命名实体识别)中文语料,一站式获取☆129Updated 5 years ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆450Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- 基于BERT+BiLSTM+CRF实现中文命名实体识别☆141Updated 4 years ago
- Bert分类,语义相似度,获取句向量。☆65Updated 2 months ago
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- 针对3个语料库,玻森数据 (https://bosonnlp.com) 、1998年人民日报标注数据、MSRA微软亚洲研究院开源数据,在前人的基础上,重新升级换代,达到更高的精确率。☆13Updated 5 years ago
- 中文文本情感分类数据集分享 chinese sentiment datasets☆81Updated 4 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆140Updated 3 years ago
- Comparison of Chinese Named Entity Recognition Models between NeuroNER and BertNER☆328Updated 5 years ago
- multi-label-classification-4-event-type☆132Updated last year
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆121Updated last year
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆126Updated 3 years ago
- 使用两种方法(抽取式Textrank和概要式seq2seq)自动提取文本摘要☆212Updated 5 years ago
- A light NER Tool,NER标注工具,基于Vue & FastAPI,带NER数据增强☆64Updated 4 years ago
- 教育行业新闻 自动文摘 语料库 自动摘要☆196Updated 6 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆324Updated last year
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆70Updated 4 years ago