NLPIR-team / nlpir-pythonLinks
NLPIR-python A python wrapper and toolkit for NLPIR
☆37Updated 2 years ago
Alternatives and similar repositories for nlpir-python
Users that are interested in nlpir-python are comparing it to the libraries listed below
Sorting:
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆224Updated 7 years ago
- 地址标准化☆125Updated last year
- 中文文本相似度计算器☆164Updated last year
- Core Data of HowNet and OpenHowNet Python API☆629Updated 3 years ago
- 短文本聚类预处理模块 Short text cluster☆279Updated 5 years ago
- 基于法律裁判文书的事件抽取及其应用,包括数据的分词、词性标注、命名实体识别、事件要素抽取和判决结果预测等内容☆603Updated 5 months ago
- pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,BERT等分类模型实现,开箱即用。☆519Updated last year
- 文本相似度(匹配)计算,提供Baseline、训练、推理、指标分析...代码包含TensorFlow/Pytorch双版本☆180Updated 3 years ago
- SmoothNLP 金融文本数据集(公开) Public Financial Datasets for NLP Researches Only☆491Updated 6 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆287Updated 2 years ago
- An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com☆552Updated 2 years ago
- 中文地址提取工具,支持中国三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。☆236Updated last year
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆351Updated last year
- 字符串地址查询,支持 自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆95Updated 4 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆727Updated 2 years ago
- 北京航空航天大学大数据高精尖中心自然语言处理研究团队对信息抽取领域的调研。包括实体识别,关系抽取,属性抽取等子任务,每类子任务分别对学术界和工业界进行调研。☆472Updated 3 years ago
- 适用于中文分词的经济金融词典☆86Updated 4 years ago
- 中文问题句子相似度计算比赛及方案汇总☆304Updated 4 years ago
- 大连理工大学情感词汇本体库及其他相关操作☆143Updated 8 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆327Updated 2 years ago
- 中文突发事件语料库(Chinese Emergency Corpus)-上海大学-语义智能实验室☆716Updated 6 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 4 years ago
- Causality event extraction demo project including casual patterns and experiment on large scale corpus. 基于因果关系知识库的因果事件图谱实验项目,本项目罗列了因果显式表达…☆426Updated 6 years ago
- DoTAT 是一款基于web、面向领域的通用文本标注工具,支持大规模实体标注、关系标注、事件标注、文本分类、基于字典匹配和正则匹配的自动标注以及用于实现归一化的标准名标注,同时也支持迭代标注、嵌套实体标注和嵌套事件标注。标注规范可自定义且同类型任务中可“一次创建多次复用”。…☆622Updated 2 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 4 years ago
- 文本聚类(Kmeans、DBSCAN、LDA、Single-pass)☆351Updated 4 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆208Updated last year
- TextClf :基于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆245Updated 2 years ago
- 中文文本聚类☆122Updated 3 years ago
- 基于哈工大同义词词林扩展版的单词相似度计算方法☆371Updated 2 years ago