wangyulu1993 / ranqi_word_splitLinks
借助jieba分词库和与之相关的算法。用于测试对非规范地址的分析、试分词,并进一步设计数据清洗算法 。
☆37Updated 8 years ago
Alternatives and similar repositories for ranqi_word_split
Users that are interested in ranqi_word_split are comparing it to the libraries listed below
Sorting:
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆197Updated 5 years ago
- 基于TF-IDF余弦相似度的地址语义搜索解析匹配服务☆209Updated 2 years ago
- 房新数据中文地址分词☆62Updated 6 years ago
- 根据企业名称对企业类型进行分类☆38Updated 6 years ago
- 机器学习可视化平台☆54Updated 5 years ago
- 知识图谱车音工作项目☆251Updated 7 years ago
- mml是类似于阿里云的机器学习平台☆54Updated 2 years ago
- 经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定☆125Updated 5 years ago
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆97Updated 4 years ago
- 地址标准化☆121Updated last year
- 爬虫-百度百科-知识图谱探索☆199Updated 5 years ago
- Personal atom notebook☆94Updated this week
- 语义理解/口语理解,项目包含有词法分析:中文分词、词性标注、命名实体识别;口语理解:领域分类、槽填充、意图识别。☆182Updated 6 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- 基于某城市移动终端用户的运营商数据预测未来三月内用户是否会终端变迁(用户从当前使用的手机品牌更换为其他手机品牌)。应用xgboost算法和随机森林算法组合成多学习器预测模型。☆53Updated 9 years ago
- “魔镜杯”风控算法大赛 拍拍贷风控模型,接近冠军分数☆194Updated 8 years ago
- 医疗保险领域知识图谱☆132Updated 7 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- 啊哈自然语言处理包,提供包括分词、依存句法分析、语义角色标注、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。☆307Updated 10 months ago
- 融360智能金融算法大赛——拒绝推断☆26Updated 5 years ago
- 基于知识图谱的智能问答机器人☆219Updated 7 years ago
- 根据地址提取省、市、区/县、街道,并进行标准化☆23Updated 3 years ago
- 基于开源保险产品数据构建的保险知识图谱及简易问答系统☆40Updated 5 years ago
- CCF大数据竞赛--中文地址魔方大赛--第一名☆37Updated 8 years ago
- 智能客服☆105Updated 6 years ago
- 短文本相似度☆103Updated 3 years ago
- 数据标注系统☆34Updated 6 years ago
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆295Updated 7 years ago
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆114Updated 11 months ago
- company name parser, extract company name brand. 中文公司名称分词工具,支持公司名称中的地名,品牌名(主词),行业词,公司名后缀提取。☆91Updated 2 years ago