gh289054531 / machine_learning_and_data_miningLinks
常见数据挖掘和机器学习算法
☆33Updated 11 years ago
Alternatives and similar repositories for machine_learning_and_data_mining
Users that are interested in machine_learning_and_data_mining are comparing it to the libraries listed below
Sorting:
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago
- 基于spark、mahout和spring boot构建的推荐系统☆131Updated 3 months ago
- 推荐算法☆30Updated 10 years ago
- ☆149Updated 11 years ago
- lyq算法库,涉及到相关数据挖掘,解压缩,模式匹配,图算法等多领域算法☆132Updated 10 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- BP神经网络分类器☆128Updated 9 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆30Updated 7 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 一套涵盖核心编程,人工智能,数字图像处理,自然语言处理,推荐与搜索,云服务领域的Java框架.☆87Updated 3 years ago
- A big data platform for analyzing web access logs☆53Updated 2 years ago
- Document preprocessing for preparing formatted input data which is suitable for LibSVM tool.☆50Updated 8 years ago
- 一个基于Spring Boot的Storm开发手脚架,开箱即用!集成读写Kafka、写Redis、写MySQL示例。☆59Updated 6 years ago
- java开发的基于kafka、xlog的web日志实时分析storm topology。☆56Updated 10 years ago
- jvm 学习中积累的代码☆32Updated 10 years ago
- 用java实现的贝叶斯分类算法。用于大数据的分类。☆41Updated 9 years ago
- 网络爬虫☆52Updated 11 years ago
- Tree-split 搬新家..给各位带来的不便深表歉意☆54Updated 8 years ago
- 舆情搜索服务框架,其中lucene和solr版本为4.8。☆61Updated 9 years ago
- 微博情感分析☆12Updated 11 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 实现中文文本分类,支持文件、文本分类,基于多项式分布的朴素贝叶斯分类器。由于工作实际应用是二分类,加之考虑到每个分类属性都建立map存储词语向量可能引起的内存问题,所以目前只支持二分类。当然,直接复用这个结构扩展到多分类也是很容易。之所以自己写,主要原因是没有仔细研读mah…☆22Updated 8 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 7 years ago
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 9 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 算法库(Java实现)☆35Updated 11 years ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆168Updated 8 years ago
- Fitting是一个面向大数据的统一的开发框架,由大快搜索主导并完全开源,克服了大数据技术开发涉及技术面广,各组件间缺乏统一规范等问题,能有效降低大数据的学习难度,并提高大数据项目的开发效率并可与开源项目混用。 Fitting遵循Apache2.0开源协议,采用类黑箱框架模…☆177Updated 2 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago