flaskeer / carhome
抓取汽车之家的数据
☆35Updated 8 years ago
Alternatives and similar repositories for carhome:
Users that are interested in carhome are comparing it to the libraries listed below
- 搜狐实习自动回复项目:语音识别、问题过滤、答案推荐☆8Updated 10 years ago
- ☆21Updated 8 years ago
- 个性化推荐算法的通用处理框架,基于Mahout和Lucene☆18Updated 9 years ago
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端实现,服务器也提供了计算的接口,方便客户端自己扩展☆23Updated 11 years ago
- 分布式网络爬虫架构☆16Updated 8 years ago
- 聪明的表格(一套数据源展示表格与图形,并且支持导出至EXCEl)☆29Updated 9 years ago
- 这是一个开源的互联网在线广告投放系统。该系统可用于网站、视频播放的所有页面广告、视频广告以及无线客户端、TV广告的管理、播放、定向和统计,包括了业务管理、售前计划管理、广告活动管理、广告引擎、播放器内广告、展示广告、数据及商业智能、人群定向、第三方广告管理等几大模块。采用C…☆87Updated 9 years ago
- 企业微信服务公共号,用于企业通讯录,公司基本信息、班车信息、日常信息、福利待遇等信息,以及相关的通知公告。☆42Updated 10 years ago
- 一个根据搜狗微信进行微信公众号采集的程序☆16Updated 9 years ago
- 消息推送群推restful,支持Android和ios,Android与activemq集成,ios与javapns集成☆15Updated 9 years ago
- java 基于selenium抓取搜狗微信公众号文章☆49Updated 9 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆19Updated 8 years ago
- 图片服务器,能够对源图片进行转换(指定高宽,等比缩放,添加水印,添加业务图标,改变透明度等),并且进行业务图片的缓存,提供业务图片的静态地址等☆35Updated 8 years ago
- 关于通过百度地图API采集POI数据,并存储到HBase的项目。☆24Updated 8 years ago
- 简单高效的URL关键词提取工具☆15Updated 6 years ago
- ☆28Updated 8 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- A experiment for hot word recommend using Openresty & Redis☆19Updated 8 years ago
- 数据平台(DataPlateform),最初的设计想法是:当今大数据横行,我们也不能落后。所以就想着写一个这样的平台系统。此项目集爬虫、搜索、Hadoop、Dwr推送、Quartz定时任务于一体的平台,其目的是想通过抓取互联网数据,通过大数据推测人或者某一事物的下一行为。C…☆18Updated 7 years ago
- Search Engine for Chinese base on Solr(基于solr的中文搜索引擎框架)☆27Updated 12 years ago
- 微博情感分析☆12Updated 11 years ago
- 多种分词器的封装,重点修改了原IK/MMSeg4j分词器,增加分词器对象共享池和Lucene/Solr封装,其中Lucene/Solr版本为5.5.0。☆30Updated 7 years ago
- 新版代码生成器☆10Updated 6 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆76Updated 11 years ago
- 基于bootstrap实现的一套监控类项目开发平台☆20Updated 6 years ago
- 本项目已经迁移到码云 gitee.com,此处不再更新!☆42Updated 12 years ago
- JEECMS是一款基于JAVA技术研发的站群管理系统。 1、支持大规模网站群管理; 2、跨站全文检索、数据共享; 3、微官网/手机网站同步建设; 4、高效二次开发的插件化管理 5、支持可视化模板制作;☆25Updated 8 years ago
- 开源 scm crm wms解决方案☆13Updated 8 years ago
- 推荐系统相关代码☆23Updated 9 years ago
- 用于IP定位,包含了纯真IP库,和自己爬出来的本地文本库两种方法。☆13Updated 10 years ago