ttjjlw / Embeding
训练词向量
☆21Updated 4 years ago
Alternatives and similar repositories for Embeding:
Users that are interested in Embeding are comparing it to the libraries listed below
- 利用bert预训练模型生成句向量或词向量☆28Updated 4 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 事件抽取-目前限定火灾新闻☆20Updated 5 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆38Updated 5 years ago
- 参考NER,基于BERT的电商评论观点挖掘和情感分析☆41Updated 5 years ago
- 利用Bert获取中文字、词向量☆10Updated 3 years ago
- 多标签文本分类☆53Updated 5 years ago
- Reproducing the paper — Deep Short Text Classification with Knowledge Powered Attention☆102Updated 4 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 6 years ago
- 使用开源的Bert-as-Service预训练生成文档特征向量,基于k-means对COVID-19文献聚类,t-SNE可视化数据,通过LDA为每个簇生成主题关键词,画Bokeh图实现按簇、关键词搜索和筛选数据。☆19Updated 4 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification,seq2seq,attention,beam search☆32Updated 2 years ago
- pytorch implementation of multi-label text classification, includes kinds of models and pretrained. Especially for Chinese preprocessing.☆75Updated 5 years ago
- 实现功能:新输入一段文本,与已有数据进行相似度进行比较,返回TOP10的文本。主要实现方法:jieba中文分词、gensim、TF-IDF词汇重要性、cosine余弦相似度。☆11Updated 4 years ago
- 本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。☆66Updated 3 years ago
- 之江-电商评论观点挖掘的比赛,基于pytorch-transformers版本,暂时只实现了BERT做aspect+opinion+属性分类+情感极性的联合标注,还未加上CRF。☆33Updated 5 years ago
- 疫情期间网民情绪识别比赛分享+top1~3解决方案☆50Updated 4 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆33Updated 4 years ago
- 一个简单的中文事件抽取模型,触发词和实体联合标注识别,同时判定实体角色。☆74Updated 4 years ago
- bert pytorch模型微调用于的多标签文本分类☆132Updated 5 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆33Updated last year
- 根据褒贬种子词,利用SO-PMI构建情感词典☆25Updated 9 years ago
- 基于Pytorch实现的一些经典自然语言处理模型中文短文本分类任务,包含TextCNN,TextRCNN,FastText,BERT,ROBERT以及ERNIE☆53Updated 4 years ago
- 主要是实现nlp常用网络以及结果比较,各模型的优劣势,如:FastText,TextCNN,TextRNN,TextRCNN,BiLSTM,Seq2seq,BERT,Transformer,ELMo以及Attention机制等等。☆45Updated 5 years ago
- Bert预训练模型fine-tune计算文本相似度☆100Updated last year
- 疫情期间网民情绪识别代码,包含lstm,bert,xlnet,robert,最高f1为0.725 部署在Google colab☆43Updated 4 years ago
- Named Entity Recognition for Chinese Drug Instructions☆16Updated 3 years ago
- 在bert模型的pre_training基础上进行text_cnn文本分类☆78Updated 5 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆61Updated 4 years ago
- ☆20Updated 3 years ago
- CCKS2020面向金融领域的小样本跨类迁移事件抽取baseline☆55Updated 2 years ago