wangyulu1993 / ranqi_word_split
借助jieba分词库和与之相关的算法。用于测试对非规范地址的分析、试分词,并进一步设计数据清洗算法 。
☆37Updated 8 years ago
Alternatives and similar repositories for ranqi_word_split:
Users that are interested in ranqi_word_split are comparing it to the libraries listed below
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆194Updated 4 years ago
- 融360智能金融算法大赛——拒绝推断☆25Updated 5 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 7 years ago
- 房新数据中文地址分词☆62Updated 5 years ago
- 中文命名实体识别(公司名称),Tensorflow 1.3 + Python3☆38Updated 7 years ago
- 基于TF-IDF余弦相似度的地址语义搜索解析匹配服务☆205Updated 2 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆36Updated 5 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆84Updated 6 years ago
- 拍拍贷网贷数据挖掘,风控建模☆48Updated 7 years ago
- 基于RFM和决策树模型构建专家推荐系统。融合了RFM模型和决策树模型,结合专业运营人员的业务经营,发掘潜在用户,进行推荐营销召回。☆88Updated 10 months ago
- 利用python进行反欺诈检测☆34Updated 6 years ago
- 知识图谱☆29Updated 7 years ago
- 基于用户行为的用户画像项目☆73Updated 7 years ago
- graphx知识图谱、图计算相关☆64Updated 7 years ago
- 根据地址提取省、市、区/县、街道,并进行标准化☆23Updated 2 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 7 years ago
- 用户评论标签挖掘☆71Updated 7 years ago
- Event monitor based on online news corpus including event storyline and analysis,基于给定事件关键词,采集事件资讯,对事件进行挖掘和分析。☆152Updated 6 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 6 years ago
- 知识图谱轻量框架☆62Updated 9 years ago
- 知识图谱车音工作项目☆250Updated 7 years ago
- 短文本相似度☆103Updated 3 years ago
- 【梳理】FDDC2018金融算法挑战赛02-A股上市公司公告信息抽取☆93Updated 6 years ago
- mml是类似于阿里云的机器学习平台☆54Updated 2 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- 经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定☆125Updated 5 years ago
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆96Updated 4 years ago
- 舆情分析平台☆33Updated 7 years ago