blackAndrechen / data_mine
Apriori and fp-growth implement of python
☆259Updated 5 years ago
Alternatives and similar repositories for data_mine:
Users that are interested in data_mine are comparing it to the libraries listed below
- 使用sklearn做特征工程☆169Updated 6 years ago
- FP-growth codes in "Machine Learning in Action"☆53Updated 6 years ago
- 常见的数据预处理,包括数据加载、缺失值&异常值处理、描述性变量转换为数值型、训练测试集划分、数据规范化☆40Updated last year
- the fp-growth algorithm with python3.☆31Updated 6 years ago
- 一些机器学习算法的demo。普通最小二乘法,决策树(Iris鸢尾花数据集),KNN(mnist手写数字数据集),朴素贝叶斯分类西瓜数据集,trec06c数据集垃圾邮件分类(spam),逻辑斯蒂回归,随机梯度下降SGD与全梯度下降的对比,mnist中8和9的二分类,泰坦尼克号…☆175Updated 6 years ago
- 开源的各大比赛baseline☆376Updated 2 years ago
- Python实现经典分类回归、关联分析、聚类以及推荐算法等☆208Updated 6 years ago
- [大数据课程作业]分别采用神经网络、线性回归、SVM方法预测学生成绩☆44Updated 6 years ago
- WeChat Official Accounts, zhihu and CSDN'blog code☆262Updated 4 years ago
- Z Lab数据实验室开源代码汇总☆198Updated 8 months ago
- 利用Encoder对二分类任务的序列数据进行概率预测☆50Updated 4 years ago
- 2020 招商银行FinTech 数据赛道 rank10☆107Updated 4 years ago
- Basic data mining model, including feature importance display☆461Updated 6 months ago
- 文本聚类(Kmeans、DBSCAN、LDA、Single-pass)☆339Updated 3 years ago
- 包括决策树和随机森林进行离职人员预测,Xgboost和lightGBM的应用☆281Updated 4 years ago
- 2019年CCF大数据与计算智能大赛乘用车细分市场销量预测冠军解决方案☆260Updated 5 years ago
- 诈骗电话识别☆48Updated 4 years ago
- 决策树、随机森林☆47Updated 6 years ago
- 利用Logistic回归实现信用卡欺诈检测☆48Updated 3 years ago
- ☆379Updated 9 months ago
- 图神经网络(GNN)学习笔记☆67Updated 3 years ago
- 基于真实业务上手数据挖掘(银行流失预警):数据的处理、LightGBM、skLearning包(里面含有:GridSearchCV寻找最优参、StratifiedKFold分层5折切分、_test_Split单次数据切分等)、叠层模型融合、画AUC图、画混淆矩阵图,并输出预…☆92Updated 2 years ago
- 用 jupyter notebook做的一些机器学习项目☆79Updated 5 years ago
- 数据竞赛笔记fork☆66Updated last year
- 多维监控异常根因分析,复现论文ISSRE 2019 REG paper 'Generic and Robust Localization of Multi-Dimensional Root Cause'.☆51Updated 2 years ago
- Data Analysis and Mining(数据分析与挖掘)☆315Updated 4 years ago
- 中文文本聚类☆122Updated 2 years ago
- 整理记录本人担任课程助教设计的四个机器学习实验,主要涉及简单的线性回归、朴素贝叶斯分类器、支持向量机、CNN做文本分类。内附实验指导书、讲解PPT、参考代码,欢迎各位码友讨论交流。☆115Updated 7 years ago
- 科技战疫-大数据公益挑战赛-DataFountain重点区域人群密度预测 第1名方案☆38Updated 3 years ago
- BDCI2020 - 大数据时代的Serverless工作负载预测☆27Updated 4 years ago