imhuster / funNLPLinks
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据、百度中文问答数据集、句子相似度匹配算法集合、bert资源、文本生成&摘要相关工具、cocoNLP信息抽取工具、国内电话号码正则匹配、清华大学XLORE:中英文跨语言百科知识图谱、清华大学人工智能技术…
☆151Updated 6 years ago
Alternatives and similar repositories for funNLP
Users that are interested in funNLP are comparing it to the libraries listed below
Sorting:
- 中国大陆 31 个省份最近几日新增工商企业注册信息以及其 他部分企业数据,大概100余万信息,包含企业名称、注册地址、统一社会信用代码、省份、城市、注册日期、经营范围、负责人、邮箱、注册资金、企业类型等资料。 In 31 provinces in mainland China…☆177Updated 5 years ago
- 中国城市数据集☆78Updated 4 years ago
- 微信公众号语料库☆582Updated 6 years ago
- 写疾病数据分析用到的所有东西☆198Updated 5 years ago
- wonderfulsuccess 的 WCplus 最新版源码,已破解☆238Updated 6 years ago
- 根据姓名来判断性别☆611Updated 5 years ago
- 中文相关词典和语料库。☆174Updated 10 years ago
- 中华人民共和国行政区划代码/身份证地址码☆36Updated 4 years ago
- 公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。☆1,265Updated last year
- NLU is hard!!!☆273Updated 6 years ago
- 点睛 - 头条号文章标题生成工具 (Dianjing, AI to write Title for Articles)☆240Updated 7 years ago
- ☆105Updated 4 years ago
- ☆112Updated 5 years ago
- Some useful Chinese corpus datasets 中文语料小数据☆534Updated 5 years ago
- 中文地址提取工具,支持中国三级区划地址(省、市、区)提取和映射,支持地址热力图绘制。☆230Updated 7 months ago
- 微信公众号爬虫☆327Updated 7 years ago
- 基于搜狗微信的公众号文章爬虫☆227Updated last year
- 新闻抓取(微信、微博、头条...)☆225Updated 2 years ago
- 下载搜狗、百度、QQ输入法的词库文件的 python 爬虫,可用于构建不同行业的词汇库☆115Updated 7 years ago
- 一个爬取企查查网站中所有中国企业与公司基本信息的爬虫程序。☆210Updated 8 years ago
- A Spider(with and w/o Scrapy) for crawling data from China Judgements Online(中国裁判文书网).☆21Updated 7 years ago
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆196Updated 5 years ago
- 用TF特征向量和simhash指纹计算中文文本的相似度☆216Updated 8 years ago
- Dataset for couplets. 70万条对联数据库。☆738Updated 4 months ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆222Updated 6 years ago
- 中国各种公开的数据, 申万行业分类, 国民经济行业分类, 中国行政编码数据, 申银万国行业分类标准☆106Updated 6 years ago
- BosonNLP HTTP API 封装库(SDK)☆163Updated 6 years ago
- 微信公众号-文章-无限制抓取☆157Updated 6 years ago
- 基于行块分布函数的通用网页正文抽取算法的Python版本实现,添加了英文支持/ Web page content extraction algorithm, support both Chinese and English☆484Updated 5 years ago
- 🌄 中国城市经纬度数据。☆315Updated last year