kikizxd / Data_preprocessingLinks
常见的数据预处理,包括数据加载、缺失值&异常值处理、描述性变量转换为数值型、训练测试集划分、数据规范化
☆47Updated 2 years ago
Alternatives and similar repositories for Data_preprocessing
Users that are interested in Data_preprocessing are comparing it to the libraries listed below
Sorting:
- 数据预处理过程(属性选择, 异常值处理, 归一化, 标准化等)☆65Updated 5 years ago
- 数据特征工程、各种机器学习回归模型、回归数据预处理☆43Updated 6 years ago
- 时间序列ARIMA模型的销量预测☆65Updated 7 years ago
- 包括决策树和随机森林进行离职人员预测,Xgboost和lightGBM的应用☆287Updated 5 years ago
- 客流量时间序列预测模型☆130Updated 3 years ago
- 机器学习预测模型,分别用逻辑回归,决策树,随机森林,神经网络,XGBOOST和支持向量机算法建模,交叉验证,并选出AUC最优的模型。特征工程优化后,AUC值达到0.8259☆57Updated 5 years ago
- 机器学习预测系统汇总:包括贝叶斯网络、马尔科夫模型、线性回归、岭回归、多项式回归、决策树回归、深度神经网络预测☆90Updated 5 years ago
- 模型优化调参---网格搜索(五折交叉验证)☆12Updated 6 years ago
- 通过修改transformer使其可以预测金融时间序列☆38Updated 4 years ago
- 机器学习数据预处理:包括画数据分布图、特征筛选、调参技巧☆12Updated last year
- 利用python对3000个数据利用机器学习算法建立模型,并预测未来客户信用风险。处理数据不均衡问题时采用了SMOTE过采样以及随机过采样技术;通过相关性分析进行特征选择;建模过程中用到了Logistic回归、SVM、随机森林、GBDT四种模型,并通过网格搜索法确定最优参数…☆34Updated 3 years ago
- 机器学习集成模型之Stacking各类模型及工具源码☆120Updated 5 years ago
- 利用Python实现三层BP神经网络☆84Updated 7 years ago
- 房价预测完整项目:1.爬取链家网数据 2.处理后,用sklearn中几个逻辑回归机器学习模型和keras神经网络搭建模型预测房价 最终结果神经网络效果更好,R^2值0.75左右☆245Updated 7 years ago
- 利用时间序列预测汽车销量☆44Updated 7 years ago
- 使用改良的Transformer模型应用于多维时间序列的分类任务上☆94Updated 4 years ago
- 集成学习Stacking方法详解☆79Updated 6 years ago
- 利用sklearn实现机器学习算法:线性回归、逻辑回归、决策树、随机森林、SVM等☆188Updated 5 years ago
- Z Lab数据实验室开源代码汇总☆209Updated last year
- Codes for time series forecast☆146Updated 5 years ago
- 基于统计学的时间序列预测(AR,ARM).☆294Updated 5 years ago
- Regression prediction of time series data using LSTM, SVM and random forest. 使用LSTM、SVM、随机森林对时间序列数据进行回归预测,注释拉满。☆200Updated 5 years ago
- 异常值检测算法总结☆203Updated 5 years ago
- 【Numpy 手写实现】SVM 支持向量机 | KNN K近邻 | Kmeans | Logistic Regression 逻辑回归 | Maximum Entropy 最大熵 | Naive Bayes 朴素贝叶斯 | Perception 感知机 | Decision…☆215Updated 5 years ago
- 基于ARIMA时间序列的销量预测模型,实际预测准确率达90%以上,内含有测试记录和实际上线效果。☆110Updated 6 years ago
- 如何使用ARIMA模型预测世界肺炎确诊人数?【时序数据预测】☆40Updated 5 years ago
- 阿里云天池大赛赛题解析☆152Updated 4 years ago
- 《应用时间序列分析》易丹辉、王燕著; 案例Python实现☆17Updated 6 years ago
- 建立SARIMA-LSTM混合模型预测时间序列问题。以PM2.5值为例,使用UCI公开的自2013年1月17日至2015年12月31日五大城市PM2.5小时检测数据,将数据按时间段划分,使用SARIMA过滤其线性趋势,再对过滤后的残差使用LSTM进行预测,最后对预测结果进行…☆84Updated 7 years ago
- 《Python数据预处理技术与实践》源码下载☆210Updated 6 years ago