17621192638 / JiebaLexiconLinks
构建中国百科词库,作为jieba分词的自定义词库。爬取百度拼音输入法词库,将.bdict文件解析为txt文件.python3.
☆27Updated 6 years ago
Alternatives and similar repositories for JiebaLexicon
Users that are interested in JiebaLexicon are comparing it to the libraries listed below
Sorting:
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆165Updated 3 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 7 years ago
- 图书名语料库。含部分电影、游戏名称。☆72Updated last year
- 一个基于最新版本TensorFlow的Char RNN实现。可以实现生成英文、写诗、歌词、小说、生成代码、生成日文等功能。☆180Updated 7 years ago
- 物种名称语料库。植物名,动物名。☆49Updated last year
- 下载搜狗、百度、QQ输入法的词库文件的 python 爬虫,可用于构建不同行业的词汇库☆115Updated 7 years ago
- 古诗词语料库☆135Updated 8 years ago
- This is a corpus of Chinese abbreviation, including negative full forms.☆196Updated 3 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 5 years ago
- 常用的中文停用词表☆76Updated 7 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆82Updated 3 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆222Updated 6 years ago
- 人民日报语料处理工具集 | Tools for Corpus of People's Daily☆282Updated last year
- 通用新闻类网站分布式爬虫☆77Updated 6 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 基于哈工大同义词词林扩展版的单词相似度计算方法☆367Updated 2 years ago
- 中国古诗生成(文本生成)☆133Updated 7 years ago
- 对小说文本进行分析,提炼小说剧情内容和人物关系☆85Updated 6 years ago
- 各大中文分词性能评测☆157Updated 6 years ago
- 文本特征提取,适用于小说,论文,议论文等文本,提取词语、句子、依存关系等特征。python开发。☆41Updated 7 years ago
- 基于谷歌大规模网页去重simhash算法,对海量文章(长文本)进行去重。☆11Updated 2 years ago
- 百度百科爬虫☆72Updated last year
- 中文文本错别字检测以及自动纠错 / Autochecker & autocorrecter for chinese☆296Updated 7 years ago
- 基于Char RNN实现的“作家”应用,可以写诗也可以生成名字,看起来还☆87Updated 4 years ago
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆113Updated 6 years ago
- chatbot based on music region using method including es and music kb.基于14W歌曲知识库的问答尝试,功能包括歌词接龙,已知歌词找歌曲以及歌曲歌手歌词三角关系的问答。☆273Updated 6 years ago
- 汉字字符特征提取工具,可以 提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆137Updated 5 years ago
- 汉字字符特征提取器 (featurizer),提取汉字的特征(发音特征、字形特征)用做深度学习的特征 | A Chinese character feature extractor, which extracts the features of Chinese charac…☆295Updated 4 years ago
- SmoothNLP领域词汇示例 - 基于复旦公开新闻资讯库☆49Updated 5 years ago
- 中文相关词典和语料库。☆174Updated 10 years ago