wangyulu1993 / ranqi_word_splitLinks
借助jieba分词库和与之相关的算法。用于测试对非规范地址的分析、试分词,并进一步设计数据清洗算法 。
☆37Updated 8 years ago
Alternatives and similar repositories for ranqi_word_split
Users that are interested in ranqi_word_split are comparing it to the libraries listed below
Sorting:
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆199Updated 5 years ago
- 房新数据中文地址分词☆63Updated 6 years ago
- 基于TF-IDF余弦相似度的地址语义搜索解析匹配服务☆211Updated 2 years ago
- 知识图谱车音工作项目☆251Updated 7 years ago
- 机器学习可视化平台☆54Updated 5 years ago
- 基于某城市移动终端用户的运营商数据预测未来三月内用户是否会终端变迁(用户从当前使用的手机品牌更换为其他手机品牌)。应用xgboost算法和随机森林算法组合成多学习器预测模型。☆53Updated 9 years ago
- 基于RFM和决策树模型构建专家推荐系统。融合了RFM模型和决策树模型,结合专业运营人员的业务经营,发掘潜在用户,进行推荐营销召回。☆88Updated last year
- 京东小型知识图谱,包括具体手机的分类信息和商品的具体信息,以及手机评论和评论人的详细信息。☆53Updated 5 years ago
- 医疗保险领域知识图谱☆133Updated 7 years ago
- 经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定☆125Updated 5 years ago
- 1st Place Solution for【2016CCF大数据竞赛 客户画像赛题(用户画像)】☆348Updated 6 years ago
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆97Updated 4 years ago
- “魔镜杯”风控算法大赛 拍拍贷风控模型,接近冠军分数☆196Updated 8 years ago
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆296Updated 7 years ago
- 智能客服☆106Updated 6 years ago
- 2017 DF,CCF大数据与计算智能大赛——“中印对峙事件舆情分析”赛题全网数据☆25Updated 7 years ago
- 地址标准化☆123Updated last year
- 中文命名实体识别(公司名称),Tensorflow 1.3 + Python3☆38Updated 7 years ago
- 根据地址提取省、市、区/县、街道,并进行标准化☆23Updated 3 years ago
- CCF大数据竞赛--中文地址魔方大赛--第一名☆38Updated 8 years ago
- 语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。☆182Updated 6 years ago
- Personal atom notebook☆94Updated last week
- 【源码以及PPT分享】2016CCF大数据与计算智能大赛:精准营销中搜狗用户画像挖掘☆202Updated 7 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- mml是类似于阿里云的机器学习平台☆55Updated 2 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆39Updated 5 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 7 years ago
- 短文本相似度☆102Updated 3 years ago
- 利用python进行反欺诈检测☆34Updated 6 years ago
- 爬虫-百度百科-知识图谱探索☆200Updated 6 years ago