dengsiying / K-Means-improvement
K-Means聚类算法及其改进
☆31Updated 6 years ago
Alternatives and similar repositories for K-Means-improvement:
Users that are interested in K-Means-improvement are comparing it to the libraries listed below
- 以京东评论作为数据集,使用常见的机器学习算法如KNN、SVM、逻辑回归、贝叶斯、xgboost等等算法进行分类。使用深度学习中的CNN、RNN、CNN和RNN连接、Bi-GRU、bert模型进行分类。使用fastnlp的框架搭建文本分类。☆31Updated 4 years ago
- 改进的k-prototypes聚类算法☆18Updated 4 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆116Updated 5 years ago
- 机器学习的特征工程,包括特征抽取、特征预处理、特征选择、特征降维。☆25Updated 6 years ago
- 以聚类算法、LDA主题模型、分类器为基础,完成对Twitter语料的基于地理位置的主题事件挖掘,并对主题事件进行细粒度的情绪分析☆35Updated 6 years ago
- 分类类别不平衡,解决办法:采样(SMOTE和算法集成技术等)、阈值移动、调整代价或权重,附带信用卡诈骗案例☆21Updated 5 years ago
- 数据预处理之缺失值处理,特征选择☆21Updated 5 years ago
- 电商评论情感分析平台☆14Updated last year
- 聚类算法k-means的简单实现☆37Updated 6 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 基于Python实现了K-Means、GMM、DBSCAN、AGNES等四种常见的聚类算法☆68Updated 6 years ago
- K-Means is a clustering algorithm which is used for cluster analysis in data mining; it partitions the data set into k clusters. In this …☆11Updated 7 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆38Updated 5 years ago
- 现有聚类算法面向高维稀疏数据多未考虑类簇可重叠和离群点的存在,导致聚类效果不理想。针对此,提出一种可重叠子空间K-Means聚类算法(An Overlapping Subspace K-Means Clustering Algorithm, OS-K-Means)。给出类簇…☆30Updated 5 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆90Updated 5 years ago
- 机器学习算法经典案例☆107Updated 4 years ago
- 常用的特征选择方法☆68Updated 2 years ago
- 基于深度学习的文本分类聚类工具☆14Updated 7 years ago
- 构建基于逻辑回归的评分卡模型☆44Updated 6 years ago
- 探索性数据分析期末报告,text clustering with Kmeans/GMM/NMF☆12Updated 6 years ago
- 基于pytorch进行文本多分类,主要模型为双向LSTM,预测准确率83%☆42Updated 4 years ago
- [大数据课程作业]分别采用神经网络、线性回归、SVM方法预测学生成绩☆44Updated 6 years ago
- 使用k-means算法实现对用户金融数据的聚类分析☆10Updated 6 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆36Updated 6 years ago
- 基于电影评论数据的中文情感分析(含训练数据、验证数据) Machine Learning and Deep Learning implementations.☆75Updated 2 years ago
- 数据挖掘大作业, 东野圭吾小说集文本挖掘☆67Updated 8 years ago
- 2019ccf乘用车销量预测Top1%代码☆13Updated 5 years ago
- 中文文本分类与聚类☆10Updated 6 years ago
- CCF大数据与计算智能大赛-工件检测TOP1方案☆27Updated 5 years ago
- 互联网新闻情感分析赛题baseline☆42Updated 5 years ago