redraiment / district
针对中国大陆地区的查询 手机号码、电话号码、IP地址 归属地。
☆52Updated 7 years ago
Alternatives and similar repositories for district
Users that are interested in district are comparing it to the libraries listed below
Sorting:
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 8 years ago
- 自动抽取网页正文的算法,用JAVA实现☆106Updated 8 years ago
- Apache Nutch Plugins for AJAX page fetch, parse, index☆87Updated 6 years ago
- A lite distributed Java spider framework :-)☆144Updated 8 years ago
- 针对反爬虫问题的自动代理池组件☆78Updated 8 years ago
- Chinese Word Segmentation Tool, THULAC的Java实现.☆84Updated 4 years ago
- Tree-split 搬新家..给各位带来的不便深表歉意☆55Updated 8 years ago
- 中文工具集,包括中文简繁体转换、拼音转换以及中文分词。☆185Updated 9 years ago
- 一款运行于Elasticsearch之上的中文拼音智能分词插件,支持全拼、首字母、中文混合搜索☆156Updated last year
- 拉勾网数据爬虫☆32Updated 7 years ago
- JCake是整合了目前Java开发过程中的字符串处理、日期处理、邮件处理、文件处理、任务调度处理、HTTP请求处理、MD5/AES加密解密处理的一系列工具类。☆120Updated 10 years ago
- Document preprocessing for preparing formatted input data which is suitable for LibSVM tool.☆50Updated 8 years ago
- 简易敏感词处理器,支持返回敏感词,高亮敏感词,替换敏感词等操作☆263Updated 7 years ago
- An efficient algorithm for text similarity computation☆61Updated 4 years ago
- 基于Apache Nutch和Htmlunit的扩展实现AJAX页面爬虫抓取解析插件☆122Updated 10 years ago
- 基于hadoop思维的分布式网络爬虫。☆86Updated 9 years ago
- HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件。☆155Updated 6 years ago
- a simple distributed spider in Java. Java编写的一个简单分布式爬虫☆159Updated 11 years ago
- Java MVC framework, agile, fast, rich domain model, made especially for server side of mobile application (一个敏捷,快速,富领域模型的Java MVC 框架,专为 移…☆545Updated last year
- 使用SpringMVC+MyBatis+FreeMarker 创建简单的CMS内容发布系统☆86Updated 11 years ago
- CSDN官网各种信息抓取,采用jsoup/webMagic进行实现,各种爬虫策略的处理,可以很好的进行爬虫学习。【本项目只提供核心爬虫程序,不包含其它业务逻辑处理】【停止维护】☆55Updated 7 years ago
- nutcher是中文的nutch文档,包含nutch的配置和源码解析,持续更新中。☆130Updated 5 years ago
- ☆18Updated 9 years ago
- ☆86Updated 9 years ago
- 《JVM必知必会》☆67Updated 9 years ago
- 《基于行块分布函数的通用网页正文抽取》算法的Java实现;算法代码来源于该算法附带的开源实现,不过接下可能会对之修改。☆15Updated 9 years ago
- Java porting of Darts (Double ARray Trie System)☆270Updated 6 years ago
- 结巴分词(java版)☆37Updated 10 years ago
- jsearch:高性能的全文检索工具包☆93Updated 7 years ago
- A Java CAPTCHA recognition library for sticky characters☆208Updated 10 years ago