gh289054531 / machine_learning_and_data_miningLinks
常见数据挖掘和机器学习算法
☆33Updated 12 years ago
Alternatives and similar repositories for machine_learning_and_data_mining
Users that are interested in machine_learning_and_data_mining are comparing it to the libraries listed below
Sorting:
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 12 years ago
- lyq算法库,涉及到相关数据挖掘,解压缩,模式匹配,图算法等多领域算法☆131Updated 10 years ago
- 基于spark、mahout和spring boot构建的推荐系统☆130Updated 2 weeks ago
- BP神经网络分类器☆128Updated 9 years ago
- 推荐算法☆30Updated 10 years ago
- Document preprocessing for preparing formatted input data which is suitable for LibSVM tool.☆50Updated 8 years ago
- ☆149Updated 11 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- 用java实现的贝叶斯分类算法。用于大数据的分类。☆42Updated 10 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆31Updated 7 years ago
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 9 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 3 years ago
- recommend system study☆66Updated 12 years ago
- Simhash Java单机实现☆114Updated 3 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 11 years ago
- 网络爬虫☆51Updated 11 years ago
- 舆情搜索服务框架,其中lucene和solr版本为4.8。☆61Updated 9 years ago
- jvm 学习中积累的代码☆32Updated 11 years ago
- 本项目已废弃,笔记收藏整理参考:☆69Updated 5 years ago
- A big data platform for analyzing web access logs☆54Updated 3 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 8 years ago
- 基于Java实现CNN,并附MNIST和语音(MFCC特征)性别识别示例。☆118Updated 9 years ago
- ☆21Updated 9 years ago
- 基于hadoop思维的分布式网络爬虫。☆86Updated 9 years ago
- 阿里巴巴大数据竞赛☆63Updated 11 years ago
- java开发的基于kafka、xlog的web日志实时分析storm topology。☆56Updated 11 years ago
- Fitting是一个面向大数据的统一的开发框架,由大快搜索主导并完全开源,克服了大数据技术开发涉及技术面广,各组件间缺乏统一规范等问题,能有效降低大数据的学习难度,并提高大数据项目的开发效率并可与开源项目混用。 Fitting遵循Apache2.0开源协议,采用类黑箱框架模…☆180Updated 3 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 8 years ago
- 基于知识图谱技术的搜素引擎研发☆19Updated 8 years ago