explosion / spacy-pkuseg
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
☆57Updated 6 months ago
Alternatives and similar repositories for spacy-pkuseg:
Users that are interested in spacy-pkuseg are comparing it to the libraries listed below
- 各大中文分词性能评测☆157Updated 6 years ago
- A convenient Chinese word segmentation tool 简便中文分词器☆46Updated 2 months ago
- A large high-quality corpus of Chinese synonyms 一个大型、高质量的中文同义词语料库。☆43Updated 3 years ago
- CINO: Pre-trained Language Models for Chinese Minority (少数民族语言预训练模型)☆230Updated 2 years ago
- 时间抽取、解析、标准化工具☆51Updated 2 years ago
- python | 高效使用统计语言模型kenlm:新词发现、分词、智能纠错等☆162Updated 5 years ago
- 渊 - A project for Classical Chinese☆99Updated 3 years ago
- 使用 pinyin-data 和 phrase-pinyin-data 中的拼音数据文件覆盖 pypinyin 中的内置拼音数据☆56Updated 2 months ago
- 中文标点符号模型,可以给文本添加标点符号。☆138Updated 2 months ago
- 基于bert进行中文文本纠错☆232Updated last year
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆172Updated 6 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 6 years ago
- ☆102Updated 4 years ago
- Minimal keyword extraction with BERT☆79Updated 3 years ago
- 近代汉语语料库数据集 自然语言处理 语料库 古代汉语 古汉语 文言文 数字人文 计算语言☆153Updated last week
- ☆172Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆159Updated 3 years ago
- 中文文本相似度计算器☆135Updated 5 months ago
- 中文纠错☆92Updated 3 years ago
- 最好的汉字数字(中文数字)-阿拉伯数字转换工具。包含"点二八","负百分之四十"等众多汉语表达方法。NLP,机器人工程必备! The Best Tool of Chinese Number to Digits☆361Updated last year
- MiniRBT (中文小型预训练模型系列)☆266Updated last year
- 基于sentence-transformers实现文本转向量的机器人☆45Updated 2 years ago
- ☆125Updated 4 years ago
- 教育行业新闻 自动文摘 语料库 自动摘要☆197Updated 6 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆232Updated last year
- LERT: A Linguistically-motivated Pre-trained Language Model(语言学信息增强的预训练模型LERT)☆204Updated last year
- 大规模中文语料☆40Updated 5 years ago
- Corpus creator for Chinese Wikipedia☆41Updated 3 years ago
- 基于mlm方式的带有纠错功能的拼音转汉字bert预训练模型,pinyin correcter,基于pytorch框架实现☆45Updated 4 years ago
- 中文谐音词/字库(同音词/字)Chinese Homophones☆100Updated 5 years ago