haibincoder / AddressCrawerLinks
全国各城市地名抓取,包含街道、村落、小区、商店、景点等
☆22Updated 7 years ago
Alternatives and similar repositories for AddressCrawer
Users that are interested in AddressCrawer are comparing it to the libraries listed below
Sorting:
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆299Updated 8 years ago
- 字符串地址查询,支持自定义地址词库,解析地址,地址识别,地址抽取,中文地址.☆95Updated 4 years ago
- 今日头条中文新闻文本(多层)分类数据集☆401Updated 4 years ago
- 简易的中文纠错和消歧☆289Updated 10 years ago
- 文本相似度计算/文本匹配☆309Updated 5 years ago
- 速度更快、效果更好的中文新词发现☆513Updated last year
- 中文地址分词(地址元素识别与抽取),通过序列标注进行NER☆203Updated 5 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆170Updated 4 years ago
- python3实现互信息和左右熵的新词发现☆593Updated 6 years ago
- mirror of dongxiexidian/Chinese☆305Updated 7 years ago
- 地址 标准化☆125Updated 2 years ago
- 自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool) of N…☆663Updated 2 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 7 years ago
- self complement of Sentence Similarity compute based on cilin, hownet, simhash, wordvector,vsm models,基于同义词词林,知网,指纹,字词向量,向量空间模型的句子相似度计算。☆364Updated 7 years ago
- SiameseSentenceSimilarity,个人实现的基于Siamese bilstm模型的相似句子判定模型,提供训练数据集和测试数据集.☆271Updated 6 years ago
- Code for chinese error detection module, using n-gram and bi-lstm☆135Updated 6 years ago
- 神策杯2018高校算法大师赛(中文关键词提取)第二名代码方案☆309Updated 5 years ago
- Keyword extraction based on TF-IDF on specific corpus. 基于特定语料库的TF-IDF的中文关键词提取☆158Updated 6 years ago
- 一个短视频app文本审核模块的实现思路及demo☆124Updated 7 years ago
- 根据企业名称对企业类型进行分类☆38Updated 7 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆27Updated 2 weeks ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆454Updated 7 years ago
- 基于bert的中文自然语言处理工具,包括情感分析、中文分词、词性标注、以及命名实体识别功能,并提供文本分类任务、序列标注任务、句对关系判断任务的训练与预测接口☆133Updated 6 years ago
- 使用pyltp的工具,基于中文依存句法的四大名著人物情节分析系统。分为整体分析和章节分析两大模块,实现了人物篇幅分析,故事发生地分析,主要人物情绪变化分析,人物互动情况分析.☆94Updated 8 years ago
- 问题句子相似度计算,即给定客服里用户描述的两句 话,用算法来判断是否表示了相同的语义。☆369Updated 5 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆327Updated 2 years ago
- 搜集、整理、发布 预训练 中文 词向量/字向量,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆147Updated 7 years ago
- 中文单词自动纠错☆122Updated 4 years ago
- An collection of Chinese nlp corpus including basic Chinese syntatic wordset, semantic wordset, historic corpus and evaluate corpus. 中文自然…☆451Updated 7 years ago
- 基于意图识别和命名实体识别的多轮对话场景设计☆40Updated 6 years ago