ineo6 / chinese-segmentation
比较两句中文句子的相似度
☆30Updated 6 years ago
Alternatives and similar repositories for chinese-segmentation:
Users that are interested in chinese-segmentation are comparing it to the libraries listed below
- Crack zhihu captcha with tensorflow☆62Updated 6 years ago
- an n2n ocr for qq captcha, 端到端的腾讯验证码识别☆86Updated 7 years ago
- 微信公众号批量抓取器☆55Updated 8 years ago
- 提供公开代理ip的抓取,以及代理的后台api,以及代理管理页面☆19Updated 9 years ago
- 基于行块分布函数的通用网页正文(及图片)抽取 - Python版本☆115Updated 8 years ago
- 机器学习文本分类器☆46Updated 8 years ago
- 个人学习用。请star或fork原作者。☆27Updated 9 years ago
- 爬取微信公众号评论、点赞等相关信息☆43Updated 6 years ago
- 微博粉丝情绪分析☆44Updated 7 years ago
- Scrapy Spider for 各种新闻网站☆106Updated 9 years ago
- ☆17Updated 7 years ago
- 多算法综合的文本分类系统☆24Updated 8 years ago
- [译] Python 自然语言处理 中文第二版☆63Updated 6 years ago
- A Spider(with and w/o Scrapy) for crawling data from China Judgements Online(中国裁判文书网).☆20Updated 6 years ago
- BosonNLP HTTP API 封装库(SDK)☆160Updated 6 years ago
- 基于深度学习的自然语言处理库☆152Updated 6 years ago
- ⛔ [DEPRECATED] URL2io Python SDK,用于网页信息提取,如正文提取☆41Updated 4 years ago
- 把之前 hanLP-python-flask 裡面的 hanLP 單獨分出來☆60Updated 7 years ago
- 本文提出一种基于应答关系来挖掘QQ群中意见领袖的方法,该方法首先构建回应词词库,然后基于Aho-Corasick算法来匹配聊天文本中的回应词数据,构建出用户应答关系的网络结构,最后使用社交网络中重要节点识别的方法来发现意见领袖。该方法对QQ群中的意见领袖发现具有较高的准确率…☆21Updated 8 years ago
- 用TF特征向量和simhash指纹计算中文文本的相似度☆212Updated 8 years ago
- A Scrapy Project 中文门户网站新闻和评论抓取——重启维护工作☆14Updated 2 years ago
- 中文分词程序,可以在没有中文语料库的情况下通过相关性将一段文本中的中文词汇抽取出来☆51Updated 11 years ago
- ☆56Updated 6 months ago
- Event monitor based on online news corpus including event storyline and analysis,基于给定事件关键词,采集事件资讯,对事件进行挖掘和分析。☆152Updated 6 years ago
- FastText 中文文档☆61Updated 4 years ago
- ☆31Updated 6 years ago
- python crawler spider☆71Updated 7 years ago
- 百度指数-图像识别抓取,逻辑不难,代码写得渣渣☆172Updated 7 years ago
- openlaw数据爬虫v1.1 更新日期:2017.12.16 解决新版openlaw多种加密问题。引入celery轻松异步分布式,爬取速度再次翻倍!!☆58Updated 5 years ago
- CrackCaptcha Models Implemented by ModelZoo☆7Updated 5 years ago