CuiYongen / DuplicateChecking
基于 Simhash 的论文查重系统
☆74Updated 2 years ago
Alternatives and similar repositories for DuplicateChecking:
Users that are interested in DuplicateChecking are comparing it to the libraries listed below
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆50Updated 4 years ago
- 智能客服系统(智能问答)☆114Updated 4 years ago
- 文本自动摘要☆91Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆46Updated last month
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆106Updated 6 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆34Updated 5 years ago
- 📚中国近代革命历史知识图谱系统 🌈提供了知识图谱可视化、知识检索、关系检索、时空检索、时空演化、语料检索、知识抽取、知识问答等丰富而有效的中国近代革命历史知识服务。☆57Updated last year
- 利用文本挖掘技术进行新闻热点关注问题分析☆158Updated 6 years ago
- 知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。☆33Updated 5 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 6 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- 中文问答系统:使用NLP相关技术,对搜索引擎,问答社区等进行信息抽取,文本概括等,支持通识问答,社区问答和部分专业问答☆32Updated 2 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 错别字纠正算法。调用pycorrector接口,使用规则。☆67Updated 5 years ago
- 行业知识图谱,关系抽取,数据清洗,ncov,疫情数据,百科,医疗,保险,汽车,垃圾分类,产业链,投资,高考,行业专家圈子,CXO圈子☆97Updated 6 months ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 6 years ago
- 项目介绍: 智能交互金融智能聊天。具体实现用户在所有关于股票话题的智能问答。其中难点是问题 分类、数据预处理、参数提取。 ☆个人工作: 实现金融智能聊天,实现所有股票问题的精确回答。通过提取通用特征将5亿+条训练语料缩减为10w条,语料内存占用量从10G减少到2M,并将…☆63Updated 5 years ago
- 分别使用TextRank、BiLSTM和UniLM实现中文文章标题自动生成☆27Updated 4 years ago
- 通过机器学习进行敏感词的识别☆29Updated 6 years ago
- 本项目是一个知识图谱可视化程序,采用前后端分离技术实现,前端使用 Vue,后端使用 Flask☆23Updated 3 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆62Updated 4 years ago
- Intelligent Q&A system(第七届中软杯,智能问答系统)☆175Updated 2 years ago
- 一个以化妆品为主题的知识图谱项目。目前包含3000节点,15000边,口红和香水两种品类。支持图谱检索、智能问答。A Knowledge Graph project about cosmetics. At present, there are 3000 nodes, 150…☆87Updated last year
- 🤖️ 聊天机器人——夫子的「自然语言理解」模块☆89Updated last year
- 文本关键词提取,且词云可视化☆27Updated 3 years ago
- 文本特征提取,适用于小说,论文,议论文等文本,提取词语、句子、依存关系等特征 。python开发。☆41Updated 6 years ago
- 基于循环神经网络(RNN)的智能聊天机器人系统☆43Updated 3 years ago
- Simple examples of text data visualization. 文本人物可视化,词云、人物关系图谱☆113Updated 7 years ago
- 基于字符级卷积神经网络的细粒度的中文情感分析以及具体的应用,将顾客打分和评论情感进行两极映射,使用数据自动标注和基于弱监督预训练的数据增强方式自动扩充和优化数据集,实验证实了在情感分类中,使用本文的字符级卷积神经网络(C-CNN-SA)可以在不依赖分词的情况下,达到的精度和…☆42Updated 5 years ago