JiangYanting / Word_list_dataset_terminologyLinks
术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习
☆30Updated 8 months ago
Alternatives and similar repositories for Word_list_dataset_terminology
Users that are interested in Word_list_dataset_terminology are comparing it to the libraries listed below
Sorting:
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆171Updated 4 years ago
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆81Updated 5 years ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆351Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆118Updated 7 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆145Updated 2 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆224Updated 7 years ago
- 大连理工大学情感词汇本体库及其他相关操作☆141Updated 8 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆723Updated 2 years ago
- <数字人文教程>资源合集☆108Updated last year
- mirror of dongxiexidian/Chinese☆305Updated 6 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆78Updated 2 years ago
- 基于法律裁判文书的事件抽取及其应用,包括数据的分词、词性标注、命名实体识别、事件要素抽取和判决结果预测等内容☆599Updated 4 months ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆285Updated 2 years ago
- 该仓库收集了常用的中文情感词典,仅供学习☆132Updated last year
- 适用于中文分词的经济金融词典☆87Updated 4 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本 摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 8 months ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆99Updated 2 years ago
- 中文文本摘要(text summarization)工具包, 抽取式中文文本摘要 Extractive text summary of Lead3、keyword、textrank、text teaser、word significance、LDA、LSI、NMF。(gra…☆420Updated last year
- 今日头条中文新闻(文本)分类数据集☆69Updated 7 years ago
- 同义词表,反义词表,否定词表☆538Updated last year
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆74Updated 5 years ago
- GuwenModels: 古文自然语言处理模型合集, 收录互联网上的古文相关模型及资源. A collection of Classical Chinese natural language processing models, including Classical Ch…☆190Updated last year
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆118Updated 7 years ago
- Core Data of HowNet and OpenHowNet Python API☆627Updated 3 years ago
- ChineseHumorSentiment, chinese humor sentiment mining including corpus build and mining nlp methods.中文文本幽默情绪计算项目,项目包括幽默文本语料库的构建,幽默计算模型,包括…☆132Updated 6 years ago
- DoTAT 是一款基于web、面向领域的通用文本标注工具,支持大规模实体标注、关系标注、事件标注、文本分类、基于字典匹配和正则匹配的自动标注以及用于实现归一化的标准名标注,同时也支持迭代标注、嵌套实体标注和嵌套事件标注。标注规范可自定义且同类型任务中可“一次创建多次复用”。…☆621Updated last year
- 中文突发事件语料库(Chinese Emergency Corpus)-上海大学-语义智能实验室☆716Updated 6 years ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆455Updated 6 years ago
- sentiment analysis、情感分析、文本分类、基于字典、python、classification☆132Updated 4 years ago
- 基于哈工大同义词词林扩展版的单词相似度计算方法☆371Updated 2 years ago