CuiYongen / DuplicateChecking
基于 Simhash 的论文查重系统
☆80Updated 3 years ago
Alternatives and similar repositories for DuplicateChecking
Users that are interested in DuplicateChecking are comparing it to the libraries listed below
Sorting:
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆53Updated 5 years ago
- 智能客服系统(智能问答)☆114Updated 5 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆37Updated 5 years ago
- 中文问答系统:使用NLP相关技术,对搜索引擎,问答社区等进行信息抽取,文本概括等,支持通识问答,社区问答和部分专业问答☆32Updated 2 years ago
- 语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。☆181Updated 6 years ago
- 文本自动摘要☆94Updated 2 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 5 years ago
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆106Updated 10 months ago
- 通过机器学习进行敏感词的识别☆28Updated 7 years ago
- DFA 实现中文敏感词检测☆101Updated 2 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆202Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 7 years ago
- 金庸小说人物关系图谱构建☆61Updated 5 years ago
- Intelligent Q&A system(第七届中软杯,智能问答系统)☆180Updated 3 years ago
- 智能问答系统demo☆39Updated 5 years ago
- 本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调。☆48Updated 4 years ago
- 基于知识库的中文问答系统(biLSTM)☆246Updated 6 years ago
- 短文本相似度☆103Updated 3 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆94Updated last year
- python 数地工厂 NLPSDK 关键词提取 摘要提取 新词发现 事件三元组提取 数据三元组提取 逻辑三元组提取 实体识别 短语组块识别 相似度计算 概念抽象 语义联想 情感极性判定 情感对提取 实体属性情感提取 主观性计算 网页正文解析 网页表格解析 实体链接 问题解…☆17Updated 4 years ago
- 🤖️ 聊天机器人——夫子的「自然语言理解」模块☆90Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆183Updated 6 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆194Updated 9 months ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照 词频排序提取…☆106Updated 7 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 摘要、关键字、关键词组、文本相似度、分词分句(自然语言处理工具包)☆11Updated 5 years ago
- 中国法研杯-司法人工智能挑战赛☆91Updated 6 years ago
- tensorflow+bert+seq2seq 周公解梦。AI遇上玄学,说出你的梦境(dream),模型自动解析decode梦境的征兆。类似聊天机器人(chatbot,QA),你问我答。☆128Updated 5 years ago