ITYZK / DCLinks
文本查重系统
☆9Updated 5 years ago
Alternatives and similar repositories for DC
Users that are interested in DC are comparing it to the libraries listed below
Sorting:
- 一个自然语言处理的可视化系统,实现自动生成词云图、文章关键信息提取、多文档主题分布、文本分类等功能,还有一些业务数据的可视化图表展示。☆36Updated 4 years ago
- 基于BOSS直聘上海地区岗位信息,利用爬虫对数据进行爬取和存储后,对其进行自然语言分析。提取“职位描述”中的软件技能,并建模预测分析。调参后的最终模型薪资预测误差约±4.3k。☆27Updated 6 years ago
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆44Updated 3 years ago
- 关联规则和决策树组合算法在学生成绩分析中的研究——本科毕设。首先,本文基于爬取到的学生课程成绩设计以学生成绩为主题的数据仓库,为后续的成绩分析提高可靠的数据支持。其次,利用关联规则算法挖掘分析课程间的关联性,并生 成用于构造决策树的新属性。最后,通过信息增益率的思想将生成的…☆54Updated 3 years ago
- 基于深度学习的新闻分类推荐系统(Spring Boot作为客户端,Keras作为服务端)☆50Updated 5 years ago
- 2021软件杯-新闻智分系统项目开源,基于PaddleHub通过预训练模型ERNIE-Tiny在整合与爬取的新闻10分类数据集上进行微调完成模型训练,可实现精细的新闻长文本10分类任务。最后基于PyQt5完成GUI可视化界面开发以及基于VUE+FastAPI完成该项目的we…☆25Updated 3 years ago
- 实习实训大作业:基于python的电商产品评论数据情感分析☆26Updated 2 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆67Updated 4 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆79Updated 4 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆103Updated 4 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 对汽车之家论坛里的评论数据处理和分析,利用用户潜在行为数据得出用户行为特征,采用LDA主题模型得出用户评论的主题特征,采用Word2Vec词向量模型得出用户评论的文本内容特征,采用K-Means聚类得出水军文本类别,结合用户行为特征,最终实现了对网络水军的识别。☆24Updated 5 years ago
- 回归问题是数据挖掘和机器学习中常常出现的问题----本专题以 中国移动用户信用分预测 为例,对比分析几类 常见的回归算法,包括:线性回归、岭回归、贝叶斯岭回归、前馈神经网络、迭代提升树等。☆17Updated 6 years ago
- 3个小项目分别是利用 Python 实现报表自动化、某连锁超市、某银行数据分析,展示了问题分解、数据清洗、数据分析与可视化的过程。☆45Updated 5 years ago
- 基于lstm,word2vec做的豆瓣网电影评论情感分析,后期会进行整理并使用textcnn☆15Updated 5 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆42Updated 5 years ago
- 数据挖掘常用算法:关联分析Apriori算法,数据分类决策树算法,数据聚类K-means算法☆25Updated 6 years ago
- 基于PaddleNLP搭建评论观点抽取和属性级情感分析模型,并基于前后端分离式架构完成属性级情感分析Web系统搭建,通过细粒度情感分析帮助用户和商家更好决策。☆67Updated 2 years ago
- Python 数据分析案例。 包含【电影评论分析】、【慕课数据分析】、【医疗花销分析】、【心脏病、癌症、糖尿病预测】☆46Updated 3 years ago
- 垃圾邮件检测 词袋模型+机器学习、word2vec+cnn☆18Updated 5 years ago
- 计算机毕业设计Python+LSTM中华古诗词知识图谱可视化 古诗词智能问答系统 古诗词数据分析 古诗词情感分析模型 自然语言处理NLP 机器学习 深度学习 人工智能 大数据毕业设计☆15Updated 10 months ago
- 智慧物流算 法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆37Updated 6 years ago
- 该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit☆18Updated 2 years ago
- 计算机毕业设计吊炸天spark+hive+nlp慕课Mooc在线教育课程数据分析可视化大屏 知识图谱课程推荐系统 课程爬虫 文本分类 LSTM情感分析 大数据毕业设计 知识图谱 大数据毕业设计 预测系统 实时计算 离线计算 数据仓库 人工智能 神经网络☆12Updated last year
- 数据挖掘可视化系统(Data Mining Visualization System)通过数据挖掘理论、机器学习算法以及数据可视化等信息技术,并基于 Flask 框架搭建 Web 服务器,实现数据挖掘可视化。☆103Updated 4 years ago
- 毕业设计--面向高考招生咨询的问答系统设计与实现☆96Updated 2 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago
- Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐☆119Updated 4 years ago
- 毕业设计,旅游景点评论情感分析。包含携程,马蜂窝爬虫,Adaboost+bayes分类☆62Updated 3 years ago
- 基于深度学习框架pytorch实现的中文文本分类,目前包括textcnn,textrnn,textrcnn,textrnn+attention,transformer☆47Updated 3 years ago