imhuster / funNLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术…
☆150Updated 5 years ago
Alternatives and similar repositories for funNLP:
Users that are interested in funNLP are comparing it to the libraries listed below
- 中国大陆 31 个省份最近几日新增工商企业注册信息以及其他部分企业数据,大概100余万信息,包含企业名称、注册地址、统一社会信用代码、省份、城市、注册日期、经营范围、负责人、邮箱、注册资金、企业类型等资料。 In 31 provinces in mainland China…☆171Updated 5 years ago
- 写疾病数据分析用到的所有东西☆198Updated 5 years ago
- 中国城市数据集☆74Updated 3 years ago
- wechat spiders微信公众号爬虫☆109Updated 3 years ago
- 微信公众号语料库☆575Updated 6 years ago
- 中华人民共和国行政区划代码/身份证地址码☆36Updated 3 years ago
- 微信公众号-文章-无限制抓取☆158Updated 6 years ago
- 点睛 - 头条号文章标题生成工具 (Dianjing, AI to write Title for Articles)☆240Updated 6 years ago
- 中国裁判文书网爬虫(2018-08-28更新)☆339Updated 2 years ago
- NLU is hard!!!☆270Updated 5 years ago
- Some useful Chinese corpus datasets 中文语料小数据☆529Updated 4 years ago
- wonderfulsuccess 的 WCplus 最新版源码,已破解☆238Updated 5 years ago
- 中国各种公开的数据, 申万行业分类, 国民经济行业分类, 中国行政编码数据, 申银万国行业分类标准☆102Updated 5 years ago
- My Python Script☆195Updated 9 months ago
- 裁判文书数据-增量更新☆38Updated 4 years ago
- 微信公众号爬虫☆326Updated 6 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆215Updated 6 years ago
- 裁判文书网爬虫demo,2020-04-23更新☆87Updated 4 years ago
- ☆107Updated 4 years ago
- 全国工商企业信息查询 验证码破解 滑动 验证码破解示例☆218Updated 2 years ago
- This is a corpus of Chinese abbreviation, including negative full forms.☆191Updated 3 years ago
- 下载搜狗、百度、QQ输入法的词库文件的 python 爬虫,可用于构建不同行业的词汇库☆112Updated 7 years ago
- Wenshu_Spider-Scrapy框架爬取中国裁判文书网案件数据(2019-1-9最新版)☆192Updated 6 years ago
- 新闻抓取(微信、微博、头条...)☆221Updated 2 years ago
- 基于行块分布函数的通用网页正文抽取算法的Python版本实现,添加了英文支持/ Web page content extraction algorithm, support both Chinese and English☆482Updated 5 years ago
- A Spider(with and w/o Scrapy) for crawling data from China Judgements Online(中国裁判文书网).☆20Updated 6 years ago
- 爬取http://www.xicidaili.com/上代理IP,并验证代理可用性☆143Updated 5 years ago
- 中文预处理语料☆107Updated 6 years ago
- 中文分词工具评估☆61Updated 2 years ago
- 今日头条爬虫,主要爬取关键词搜索结果,包含编辑距离算法、奇异值分解、k-means聚类。☆71Updated 5 years ago