UserXiaohu / chinese-similarity
中文文本相似度计算,采用text2vec词向量工具进行计算对比。
☆16Updated 4 years ago
Alternatives and similar repositories for chinese-similarity:
Users that are interested in chinese-similarity are comparing it to the libraries listed below
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆211Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 4 months ago
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆95Updated 6 years ago
- 中文文本纠错模型,keras实现☆73Updated 3 years ago
- 今日头条中文新闻(文本)分类数据集☆63Updated 6 years ago
- selenium裁判文书网爬虫,文书网登录☆38Updated 2 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆113Updated 8 months ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆453Updated 6 years ago
- Bert预训练模型fine-tune计算文本相似度☆102Updated last year
- 中文wiki百科QA阅读理解问答系统,使用了CCKS2016数据的NER模型和CMRC2018的阅读理解模型,还有W2V词向量搜索,使用torchserve部署☆90Updated 3 years ago
- 基于bert的中文自然语言处理工具,包括情感分析、中文分词、词性标注、以及命名实体识别功能,并提供文本分类任务、序列标注任务、句对关系判断任务的训练与预测接口☆132Updated 6 years ago
- 短文本相似度☆103Updated 3 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆75Updated 4 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆63Updated 4 years ago
- 语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。☆180Updated 6 years ago
- Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。☆175Updated 4 months ago
- 作文自动打分系统☆30Updated 5 years ago
- Code for chinese error detection module, using n-gram and bi-lstm☆135Updated 6 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆48Updated 3 weeks ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆192Updated 7 months ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆200Updated 6 years ago
- bert pytorch模型微调用于的多标签文本分类☆131Updated 5 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆324Updated 2 years ago
- 使用pyltp的工具,基于中文依存句法的四大名著人物情节分析系统。分为整体分析和章节分析两大模块,实现了人物篇幅分析,故事发生地分析,主要人物情绪变化分析,人物互动情况分析.☆92Updated 7 years ago
- “英特尔创新大师杯”深度学习挑战赛 赛道2:CCKS2021中文NLP地址要素解析☆143Updated 3 years ago
- NLP research:基于tensorflow的nlp深度学习项目,支持文本分类/句子匹配/序列标注/文本生成 四大任务☆188Updated 9 months ago
- 基于意图识别和命名实体识别的多轮对话场景设计☆38Updated 5 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成