Nana0606 / hadoop_example
Hadoop基本操作,包括pagerank、kmeans、join、max_temperature、log_clean等的Mapreduce实现,以及自定义数据类型、partition、multioupt、combiner等基本操作
☆30Updated 5 years ago
Alternatives and similar repositories for hadoop_example:
Users that are interested in hadoop_example are comparing it to the libraries listed below
- 社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度☆19Updated 7 years ago
- 自实现朴素贝叶斯分类器,文本分类一百万条新闻☆40Updated 6 years ago
- CCF大数据比赛,基于主题的文本情感分析☆94Updated 6 years ago
- Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…☆143Updated 7 years ago
- 文本聚类 k-means算法及实战☆54Updated 6 years ago
- This is the program which tries to classifier the sentiment of the production's comments in JD.☆39Updated 7 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆69Updated 9 years ago
- 豆瓣Top250影评爬虫(用于情感分析语料)☆22Updated 2 years ago
- 软件工程课程设计项目/Lab409:基于词典方法和机基于器学习方法的中文情感倾向分析(Web)☆122Updated 7 years ago
- 零基础学习spark,大数据学习☆46Updated 6 years ago
- 智能问答系统demo☆39Updated 5 years ago
- 计算新闻文本类情感分析(采用TF-IDF,余弦距离,情感依存等算法)☆58Updated 7 years ago
- 基于卷积神经网络参数优化的情感分析论文code☆62Updated 7 years ago
- 使用keras框架Embedding+LSTM对短文本分类-半监督☆16Updated 7 years ago
- 机器学习、深度学习、NLP实战项目☆137Updated 7 years ago
- 基于lucene的新闻搜索引擎[中科院现代信息检索项目作业]☆18Updated 8 years ago
- 使用Django搭建的基于Neo4j知识图谱的人际关系搜索与六度关系搜索系统,使用Mongo存储语料输出,使用Neo4j维护知识图谱☆15Updated 5 years ago
- CCF2018 数据挖掘 机器学习 智能匹配 特征工程☆48Updated 5 years ago
- Python实现经典分类回归、关联分析、聚类以及推荐算法等☆212Updated 6 years ago
- CNN 实现文本分类☆181Updated 2 years ago
- some code for spark☆17Updated 8 years ago
- 以京东评论作为数据集,使用常见的机器学习算法如KNN、SVM、逻辑回归、贝叶斯、xgboost等等算法进行分类。使用深度学习中的CNN、RNN、CNN和RNN连接、Bi-GRU、bert模型进行分类。使用fastnlp的框架搭建文本分类。☆32Updated 4 years ago
- 数据挖掘大作业, 东野圭吾小说集文本挖掘☆68Updated 8 years ago
- 房价预测完整项目:1.爬取链家网数据 2.处理后,用sklearn中几个逻辑回归机器学习模型和keras神经网络搭建模型预测房价 最终结果神经网络效果更好,R^2值0.75左右☆231Updated 6 years ago
- gensim-word2vec+svm文本情感分析☆103Updated 7 years ago
- 朴素贝叶斯实现的文本分类(新闻分类)☆61Updated 9 years ago
- 数据挖掘领域十大算法代码实现☆58Updated 8 years ago
- 组会ppt与论文--每一次的精心准备都值得留下记录😛☆146Updated 5 years ago
- 对汽车之家论坛里的评论数据处理和分析,利用用户潜在行为数据得出用户行为特征,采用LDA主题模型得出用户评论的主题特征,采用Word2Vec词向量模型得出用户评论的文本内容特征,采用K-Means聚类得出水军文本类别,结合用户行为特征,最终实现了对网络水军的识别。☆24Updated 5 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆90Updated 6 years ago