MeninaChimp / KmeansLinks
一个数据挖掘里的简单聚类算法,使用了JFreeChart用于对分类结果的展示。
☆11Updated 9 years ago
Alternatives and similar repositories for Kmeans
Users that are interested in Kmeans are comparing it to the libraries listed below
Sorting:
- java分布式爬虫,主机和从机控制的机制☆14Updated 10 years ago
- 推荐系统相关代码☆23Updated 10 years ago
- 基于TF-IDF模型的文本相似度分析软件☆13Updated 8 years ago
- 分布式环境下全局id生成☆12Updated 6 years ago
- 个性化推荐算法的通用处理框架,基于Mahout和Lucene☆18Updated 10 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- 以知乎日报为数据源,全流程实践一个机器学习过程,从数据获取到数据分析,对知乎日报进行聚类、分类,并可视化这一过程☆17Updated 9 years ago
- 基于K-means算法的聚类分析☆20Updated 9 years ago
- 推荐算法☆30Updated 10 years ago
- 牛客网直通BAT算法 Java实现☆13Updated 7 years ago
- 分布式在线聊天系统☆10Updated 11 years ago
- FileMap 是一个用 Java 编写的,基于文件的高性能本地 Key - Value 存储库,可以理解为一个将数据存储在文件上的 Map,因此,其可存储巨大的数据量,而且具有持久化的效果。☆17Updated 7 years ago
- DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase 、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。☆23Updated 3 years ago
- 分布式日志分析与性能监控服务,集成flume,kafka,netty,websocket,dubbo,redis,hbase等☆11Updated 2 years ago
- 学习笔记 / 记录和分享/欢迎大佬斧正指点☆10Updated 8 years ago
- 对电影进行个性化推荐,基于Mahout框架实现的,使用的协同过滤算法☆33Updated 12 years ago
- JAVAMonitorPLUS性能监控系统,适用于监控所有Java应用,具有堆内存监控、方法区监控、GC监控、类加载监控、类编译监控与线程监控,提供堆快照下载,线程快照下载,服务器信息查看,权限验证和登录☆10Updated 3 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆36Updated 8 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 9 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 爬虫项目源码整理,使用redis进行url缓存,hbase进行详细信息的存储。使用zookeeper进行爬虫线程的状态监控。☆19Updated 10 years ago
- dubbo服务间的分布式事物☆11Updated 10 years ago
- cglib轻量化mvc框架(ioc+aop+mvc+orm+切面级事物)☆28Updated 7 years ago
- 常用文本聚类算法java实现☆15Updated 10 years ago
- 一个以文本类算法为基础、结合场景的风险防控系统☆15Updated 8 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- 用户画像代码,根据算法推算出用户的性别和年龄比率☆11Updated 7 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated 2 years ago
- 基于WebCollector的新浪微博爬虫及相关登录工具,如新浪微博Cookie获取☆14Updated 6 years ago
- 分布式、高可用的延迟调度系统、可以配合消息队列实现延迟任务队列☆12Updated last year