wangyulu1993 / ranqi_word_splitLinks
借助jieba分词库和与之相关的算法。用于测试对非规范地址的分析、试分词,并进一步设计数据清洗算法 。
☆37Updated 8 years ago
Alternatives and similar repositories for ranqi_word_split
Users that are interested in ranqi_word_split are comparing it to the libraries listed below
Sorting:
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆200Updated 5 years ago
- 基于TF-IDF余弦相似度的地址语义搜索解析匹配服务☆214Updated 2 years ago
- 知识图谱车音工作项目☆251Updated 7 years ago
- 经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定☆125Updated 5 years ago
- 房新数据中文地址分词☆62Updated 6 years ago
- 机器学习可视化平台☆54Updated 6 years ago
- 地址标准化☆125Updated last year
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆96Updated 4 years ago
- “魔镜杯”风控算法大赛 拍拍贷风控模型,接近冠军分数☆200Updated 8 years ago
- 医疗保险领域知识图谱☆133Updated 7 years ago
- Personal atom notebook☆93Updated last month
- CCF大数据竞赛--中文地址魔方大赛--第一名☆38Updated 8 years ago
- 根据企业名称对企业类型进行分类☆38Updated 6 years ago
- 利用python进行反欺诈检测☆34Updated 6 years ago
- 1st Place Solution for【2016CCF大数据竞赛 客户画像赛题(用户画像)】☆346Updated 6 years ago
- mml是类似于阿里云的机器学习平台☆55Updated 2 years ago
- 语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。☆183Updated 6 years ago
- company name parser, extract company name brand. 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。☆92Updated 3 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- 基于某城市移动终端用户的运营商数据预测未来三月内用户是否会终端变迁(用户从当前使用的手机品牌更换为其他手机品牌)。应用xgboost算法和随机森林算法组合成多学习器预测模型。☆54Updated 9 years ago
- A small tools for marking training set label in machine learning task.(crowdsourcing)☆107Updated 7 years ago
- 爬虫-百度百科-知识图谱探索☆200Updated 6 years ago
- 拍拍贷网贷数据挖掘,风控建模☆49Updated 8 years ago
- 中文命名实体识别(公司名称),Tensorflow 1.3 + Python3☆38Updated 8 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆66Updated 7 years ago
- 根据地址提取省、市、区/县、街道,并进行标准化☆23Updated 3 years ago
- 啊哈自然语言处理包,提供包 括分词、依存句法分析、语义角色标注、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。☆309Updated last year
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆56Updated 8 years ago
- 2017 DF,CCF大数据与计算智能大赛——“中印对峙事件舆情分析”赛题全网数据☆25Updated 7 years ago
- twitter用户画像☆33Updated 6 years ago