StuPeter / Sougou_dict_spider
搜狗词库爬虫,全类目下载,自动分类,scel转txt
☆199Updated 6 months ago
Related projects ⓘ
Alternatives and complementary repositories for Sougou_dict_spider
- THUOCL(THU Open Chinese Lexicon)中文词库☆852Updated last year
- 下载搜狗、百度、QQ输入法的词库文件的 python 爬虫,可用于构建不同行业的词汇库☆113Updated 7 years ago
- 由搜狗细胞词库生成的谷歌拼音输入法词典 A dict for Google Pinyin Input, exported from Sougou Pinyin Input.☆59Updated 7 years ago
- 汉字五笔转换工具☆31Updated 5 years ago
- 《现代汉语词典》(第7版)全文TXT☆246Updated 4 months ago
- 汉字自动拆分系统开发☆101Updated last year
- 《现代汉语大词典》字词头☆26Updated 3 years ago
- 中文预处理语料☆106Updated 5 years ago
- 维基百科中文语料整理☆291Updated 6 years ago
- 五笔字型超大字符集编码数据库☆85Updated 2 years ago
- 简体中文词库包含词频+注音;特殊符号词库包含希腊字母,部分数学符号,Emoji表情,序号等.☆72Updated 2 years ago
- 汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征 | Hanzi Decomposition Library allows Chinese characters to be broken down into radicals and components…☆329Updated 3 weeks ago
- 打字不翻页——Rime 输入法 双拼+辅助码方案☆128Updated last month
- This is a corpus of Chinese abbreviation, including negative full forms.☆189Updated 3 years ago
- NLU is hard!!!☆269Updated 5 years ago
- 古汉语(文言文)字典-爬取文言文字典网,制作Kindle字典.☆65Updated 6 years ago
- ☆52Updated 7 years ago
- 《通用规范汉字表》是由中华人民共和国教育部、国家语言文字工作委员会联合组织研制的汉字使用规范, 2013年6月5日正式颁布,成为社会一般应用领域的汉字规范.☆52Updated 6 years ago
- 《现代汉语词典》第 7 版的 mdict/mdx 资源。☆173Updated last year
- 词语拼音数据☆448Updated 8 months ago
- 图书名语料库。含部分电影、游戏名称。☆66Updated 7 months ago
- 中文相关词典和语料库。☆168Updated 10 years ago
- 各大中文分词性能评测☆154Updated 5 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆146Updated last year
- 汉语古典文本资料库☆247Updated 6 years ago
- 转换搜狗拼音词库为txt文件