tongchangD / PMILinks
PMI, 是互信息(NMI)中的一种特例, 而互信息,是源于信息论中的一个概念,主要用于衡量2个信号的关联程度.至于PMI,是在文本处理中,用于计算两个词语之间的关联程度.比起传统的相似度计算, pmi的好处在于,从统计的角度发现词语共现的情况来分析出词语间是否存在语义相关 , 或者主题相关的情况.
☆15Updated 4 years ago
Alternatives and similar repositories for PMI
Users that are interested in PMI are comparing it to the libraries listed below
Sorting:
- 基于bert的中文自然语言处理工具,包括情感分析、中文分词、词性标注、以及命名实体识别功能,并提供文本分类任务、序列标注任务、句对关系判断任务的训练与预测接口☆132Updated 6 years ago
- 基于bert进行中文文本纠错☆235Updated 2 years ago
- 本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。☆67Updated 4 years ago
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- 嵌入Word2vec词向量的RNN+ATTENTION中文文本分类☆151Updated 4 years ago
- 基于轻量级的albert实现albert+BiLstm+CRF☆89Updated 2 years ago
- Keyphrase or Keyword Extraction 基于预训练模型的中文关键词抽取方法(论文SIFRank: A New Baseline for Unsupervised Keyphrase Extraction Based on Pre-trained La…☆430Updated 5 years ago
- NLP research:基于tensorflow的nlp深度学习项目,支持文本分类/句子匹配/序列标注/文本生成 四大任务☆193Updated last year
- 使用bert做领域分类、意图识别和槽位填充任务☆76Updated 5 years ago
- 利用预训练的中文模型实现基于bert的语义匹配模型 数据集为LCQMC官方数据☆198Updated 5 years ago
- Named Recognition Entity based on BERT and CRF 基于BERT+CRF的中文命名实体识别☆184Updated 2 years ago
- 中文自然语言的实体抽取和意图识别(Natural Language Understanding),可选Bi-LSTM + CRF 或者 IDCNN + CRF☆185Updated 6 years ago
- 基于Bi-GRU + CRF 的中文机构名、人名识别, 支持google bert模型☆167Updated 6 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆76Updated 5 years ago
- 利用ALBERT实现文本二分类,判别是否属于政治上的出访类事件,提升模型训练和预测速度。☆74Updated 2 years ago
- chinese bertsum ; bertsum 抽取式模型中文版本;给出案例数据、全代码注释;下载即可训练、预测、学习☆205Updated 2 years ago
- Bert预训练模型fine-tune计算文本相似度☆105Updated 2 years ago
- albert + lstm + crf实体识别,pytorch实现。识别的主要实体是人名、地名、机构名和时间。albert + lstm + crf (named entity recognition)☆136Updated 2 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆128Updated 6 years ago
- NER(命名实体识别)中文语料,一站式获取☆130Updated 5 years ago
- 使用BERT模型做文本分类;面向工业用途☆220Updated 5 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆140Updated 5 years ago
- SiameseSentenceSimilarity,个人实现的基于Siamese bilstm模型的相似句子判定模型,提供训练数据集和测试数据集.☆269Updated 5 years ago
- chinese-sequence-ner多模型中文命名实体识别☆75Updated 5 years ago
- implementation several deep text match (text similarly) models for keras . cdssm, arc-ii,match_pyramid, mvlstm ,esim, drcn ,bimpm, bert, …☆290Updated 4 years ago
- 文本二分类任务,是否文档是否属于政治上的出访类事件,利用BERT提取特征,模型采用简单的DNN。☆61Updated 5 years ago
- bert pytorch模型微调用于的多标签文本分类☆134Updated 5 years ago
- 中文命名实体识别& 中文命名实体检测 python实现 基于字+ 词位 分别使用tensorflow IDCNN+CRF 及 BiLSTM+CRF 搭配词性标注实现中文命名实体识别及命名实体检测☆65Updated 6 years ago
- A trial of kbqa based on bert for NLPCC2016/2017 Task 5 (基于BERT的中文知识库问答实践,代码可跑通)☆271Updated 6 years ago
- Sequence labeling base on universal transformer (Transformer encoder) and CRF; 基于Universal Transformer + CRF 的中文分词和词性标注☆158Updated 6 years ago