lzhenboy / word2vec-ChineseLinks
a tutorial for training Chinese-word2vec using Wiki corpus
☆128Updated 5 years ago
Alternatives and similar repositories for word2vec-Chinese
Users that are interested in word2vec-Chinese are comparing it to the libraries listed below
Sorting:
- Self complemented word embedding methods using CBOW,skip-Gram,word2doc matrix , word2word matrix ,基于CBOW、skip-gram、词-文档矩阵、词-词矩阵四种方法的词向量生成☆184Updated 7 years ago
- 基于哈工大同义词词林扩展版的单词相似度计算方法☆368Updated 2 years ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆456Updated 6 years ago
- 本实验,是用BERT进行中文情感分类,记录了详细操作及完整程序☆377Updated 6 years ago
- 文本相似度计算/文本匹配☆306Updated 5 years ago
- Word2vec, Fasttext, Glove, Elmo, Bert, Flair pre-train Word Embedding☆656Updated 4 years ago
- TextClf :基于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆241Updated 2 years ago
- 腾讯word2vec模型缩小版☆516Updated 9 months ago
- bert中文分类实践☆736Updated 6 years ago
- 今日头条中文新闻文本(多层)分类数据集☆396Updated 4 years ago
- self complement of Sentence Similarity compute based on cilin, hownet, simhash, wordvector,vsm models,基于同义词词林,知网,指纹,字词向量,向量空间模型的句子相似度计算。☆362Updated 6 years ago
- BiLstm+CNN+CRF 法律文档(合同类案件)领域分词(100篇标注样本)☆386Updated 6 years ago
- 利用Python构建Wiki中文语料词向量模型试验☆523Updated 3 years ago
- 利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp☆347Updated 5 years ago
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆214Updated 4 years ago
- 搜集、整理、发布 预训练 中文 词向量/字向量,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆148Updated 7 years ago
- 使用keras实现的基于Bi-LSTM + CRF的中文分词+词性标注☆376Updated 6 years ago
- 中文文本语义相似度(Chinese Semantic Text Similarity)语料库建设☆480Updated 7 years ago
- 基于BI-LSTM+CRF的中文命名实体识别 Pytorch☆402Updated 2 years ago
- Lstm-crf,Lattice-CRF,bert-ner及近年ner相关论文follow☆565Updated 6 years ago
- 2019年百度的三元组抽取比赛,“科学空间队”源码☆767Updated 5 years ago
- ☆268Updated 5 years ago
- SiameseSentenceSimilarity,个人实现的基于Siamese bilstm模型的相似句子判定模型,提供训练数据集和测试数据集.☆269Updated 5 years ago
- 中文突发事件语料库(Chinese Emergency Corpus)-上海大学-语义智能实验室☆712Updated 5 years ago
- Causality event extraction demo project including casual patterns and experiment on large scale corpus. 基于因果关系知识库的因果事件图谱实验项目,本项目罗列了因果显式表达…☆421Updated 6 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆324Updated 2 years ago
- An off-the-shelf tool for Chinese Keyphrase Extraction 一个快速从中文里抽取关键短语的工具,仅占35M内存 www.jionlp.com☆551Updated last year
- 神策杯2018高校算法大师赛(中文关键词提取)第二名代码方案☆308Updated 5 years ago
- 使用预训练语言模型ALBERT做中文NER☆476Updated 4 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆195Updated 11 months ago