ITYZK / DC
文本查重系统
☆9Updated 4 years ago
Alternatives and similar repositories for DC:
Users that are interested in DC are comparing it to the libraries listed below
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆65Updated 4 years ago
- 一个自然语言处理的可视化系统,实现自动生成词云图、文章关键信息提取、多文档主题分布、文本分类等功能,还有一些业务数据的可视化图表展示。☆34Updated 4 years ago
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆43Updated 3 years ago
- 计算机毕业设计吊炸天spark+hive+nlp慕课Mooc在线教育课程数据分析可视化大屏 知识图谱课程推荐系统 课程爬虫 文本分类 LSTM情感分 析 大数据毕业设计 知识图谱 大数据毕业设计 预测系统 实时计算 离线计算 数据仓库 人工智能 神经网络☆11Updated last year
- 🌞🌈豆瓣电影短评数据挖掘与情感分析,爬取票房和评分榜单以及短评共20w+,数据清洗特征工程,评分预测,和短评二极性分类☆17Updated 3 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆37Updated 6 years ago
- 关联规则和决策树组合算法在学生成绩分析中的研究——本科毕设。首先,本文基于爬取到的学生课程成绩设计以学生成绩为主题的数据仓库,为后续的成绩分析提高可靠的数据支持。其次,利用关联规则算法挖掘分析课程间的关联性,并生 成用于构造决策树的新属性。最后,通过信息增益率的思想将生成的…☆50Updated 3 years ago
- 高等教育数学课程体系知识图谱☆23Updated last year
- 实习实训大作业:基于python的电商产品评论数据情感分析☆26Updated 2 years ago
- 一个数据分析项目,利用 Pandas 库进行数据预处理,缺少值填充,利用sklearn 模块建模并对多种农产品价格进行预测☆25Updated 3 years ago
- 🤖机器学习实战🤖:决策树、随机森林线性回归、逻辑回归、贝叶斯、kNN等☆26Updated 5 years ago
- Python 数据分析案例。包含【电影评论分析】、【慕课数据分析】、【医疗花销分析】、【心脏病、癌症、糖尿病预测】☆44Updated 3 years ago
- 机器学习应用平台/数据预测/文本分类☆11Updated 5 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆62Updated 5 years ago
- 利用Python编程爬虫搜集微博平台上关于大学生网课的评论,使用SPSS、机器学习、自然语言处理等方法,对收集到的文本数据进行分词、数据清洗、词频统计和聚类分析。最后根据所得到的数据进行以及分析,发现目前在线教学 中学生体验的现状、趋势以及一些待解决的问题。☆44Updated 3 years ago
- 软件工程课程设计项目/Lab409:基于词典方法和机基于器学习方法的中文情感倾向分析(Web)☆122Updated 7 years ago
- 电商产品评论数据情感分析模型☆16Updated 2 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆76Updated 4 years ago
- 垃圾邮件检测 词袋模型+机器学习、word2vec+cnn☆17Updated 5 years ago
- 决策树分类与回归模型的实现和可视化☆16Updated 3 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆102Updated 4 years ago
- 爬取天气数据并进行数据可视化分析☆28Updated 6 years ago
- 中山大学自然语言处理项目:中文分词(序列标注/命名实体识别)。Keras实现,BiLSTM+CRF框架。☆17Updated 4 years ago
- 基于BOSS直聘上海地区岗位信息,利用爬虫对数据进行爬取和存储后,对其进行自然语言分析。提取“职位描述”中的软件技能,并建模预测分析。调参后的最终模型薪资预测误差约±4.3k。☆27Updated 6 years ago
- 数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图☆70Updated last year
- 回归问题是数据挖掘和机器学习中常常出现的问题----本专题以 中国移动用户信用分预测 为例,对比分析几类 常见的回归算法,包括:线性回归、岭回归、贝叶斯岭回归、前馈神经网络、迭代提升树等。☆17Updated 6 years ago
- 基于lstm,word2vec做的豆瓣网电影评论情感分析,后期会进行整理并使用textcnn☆15Updated 5 years ago
- 基于机器学习的商品评论情感分析——毕业设计项目☆187Updated last year
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆118Updated 6 years ago
- 观察者新闻网爬虫(新闻爬虫),基于python+Flask+Echarts,实现首页与更多新闻页面爬取(Requests+etree+Xpath)+新闻存储(MySQL)+文本分析(Jieba)+可视化(新闻词云,词频统计)。☆99Updated 3 years ago