letiantian / jianshu-site-searchLinks
简书站内搜索
☆23Updated 3 weeks ago
Alternatives and similar repositories for jianshu-site-search
Users that are interested in jianshu-site-search are comparing it to the libraries listed below
Sorting:
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端实现,服务器也提供了计算的接口,方便客户端自己扩展☆24Updated 11 years ago
- 无损转换OpenCC词典为HanLP格式☆9Updated 4 years ago
- Tree-split 搬新家..给各位带来的不便深表歉意☆55Updated 8 years ago
- 基于知识图谱技术的搜素引擎研发☆19Updated 8 years ago
- 搜狐实习自动回复项目:语音识别、问题过滤、答案推荐☆8Updated 10 years ago
- 新词发现分布式机器学习算法。☆15Updated 10 years ago
- elasticsearch similarity Custom plug-in☆10Updated 11 years ago
- 一个以文本类算法为基础、结合场景的风险防控系统☆15Updated 8 years ago
- 简单高效的URL关键词提取工具☆15Updated 6 years ago
- ☆29Updated 9 years ago
- A Web Page Of Public Sentiment For P2P Industry( P2P 行业的舆情分析前端展示)☆25Updated 9 years ago
- 爬取百度指数和阿里指数,采用selenium,存入hbase,验证码自动识别,多线程控制☆32Updated 8 years ago
- 推荐系统相关代码☆23Updated 10 years ago
- 本项目转移到https://github.com/cocolian/cocolian-nlp☆34Updated 10 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- ☆14Updated 7 years ago
- 《分布式实时计算框架原理及实践案例》一书中相关章节实例介绍☆11Updated 8 years ago
- jobSpider是一只scrapy爬虫,用于爬取职位信息☆27Updated 8 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- solr自定义评分组件demo☆23Updated 3 months ago
- 微博情感分析☆12Updated 11 years ago
- 基于WebCollector的新浪微博爬虫及相关登录工具,如新浪微博Cookie获取☆14Updated 6 years ago
- 学图论数据库 Neo4j 的时候顺手翻译了它的在线课程☆34Updated 9 years ago
- Knowledge Graph Examples☆18Updated 10 months ago
- 基于mybatis + spring + maven + mysql 自动生成的工具☆13Updated 12 years ago
- 数据库访问中间件,统一的标准sql查询,底层可以是不同的数据库包括mysql、ElasticSearch、kylin、presto等。☆15Updated 7 years ago
- 语义、情感、相似度分析。☆58Updated 9 years ago
- Chinese analysis plugin which using IK analysis for Elasticsearch☆22Updated 9 years ago
- 高级结构双数组Trie树(DoubleArrayTrie) java实现☆23Updated 4 years ago
- 微博爬虫。通过调用weibo api,而非暴力爬取的方式获取信息。☆32Updated 8 years ago