CuiYongen / DuplicateChecking
基于 Simhash 的论文查重系统
☆80Updated 3 years ago
Alternatives and similar repositories for DuplicateChecking:
Users that are interested in DuplicateChecking are comparing it to the libraries listed below
- 文本自动摘要☆94Updated last year
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆53Updated 4 years ago
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 4 years ago
- 智能客服系统(智能问答)☆114Updated 5 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆183Updated 6 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 7 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 6 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆49Updated last month
- 利用文本挖掘技术进行新闻热点关注问题分析☆161Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆161Updated 3 years ago
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆113Updated 6 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 4 years ago
- 短文本相似度☆103Updated 3 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆193Updated 8 months ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 基于知识图谱的林业法律法规问答☆19Updated 2 years ago
- 根据企业名称对企业类型进行分类☆38Updated 6 years ago
- 一个短视频app文本审核模块的实现思路及demo☆119Updated 6 years ago
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆212Updated 3 years ago
- 金庸小说人物关系图谱构建☆61Updated 5 years ago
- 错别字纠正算法。调用pycorrector接口,使用规则。☆68Updated 5 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆102Updated 4 years ago
- 以nlp中情感分析为例,从没有打过标签的语料开始一步步教你怎么去打标签,然后分别以传统的机器学习模型SVM和深度学习模型LSTM去建模。☆34Updated 5 years ago
- 对话机器人,包含了看图说话,单轮对话和多轮对话,tensorflow 2.0 pytorch 1.3.1 GPT-2☆44Updated 4 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆37Updated 5 years ago
- 今日头条中文新闻(文本)分类数据集☆63Updated 6 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆200Updated 6 years ago
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆296Updated 7 years ago
- 中文商品评论短文本分类器,可用于情感分析☆359Updated 3 years ago