dongrixinyu / jiojio
A convenient Chinese word segmentation tool 简便中文分词器
☆46Updated 3 months ago
Alternatives and similar repositories for jiojio:
Users that are interested in jiojio are comparing it to the libraries listed below
- 各大中文分词性能评测☆157Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆161Updated 3 years ago
- 中文纠错☆92Updated 3 years ago
- Time-NLP的Python3版本 中文时间表达识别☆89Updated 5 years ago
- 基于bert进行中文文本纠错☆234Updated last year
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated last year
- 一个基于预训练的句向量生成工具☆137Updated 2 years ago
- MiniRBT (中文小型预训练模型系列)☆276Updated 2 years ago
- 速度更快、效果更好的中文新词发现☆512Updated last year
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 7 years ago
- 3000000+语义理解与匹配数据集。可用于无监督对比学习、半监督学习等构建中文领域效果最好的 预训练模型☆294Updated 2 years ago
- 中文谐音词/字库(同音词/字)Chinese Homophones☆102Updated 5 years ago
- ☆102Updated 4 years ago
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated 9 months ago
- Code for chinese error detection module, using n-gram and bi-lstm☆135Updated 6 years ago
- 中文近义词表 Chinese Synonyms☆256Updated 7 years ago
- Collections of resources from Joint Laboratory of HIT and iFLYTEK Research (HFL)☆367Updated 2 years ago
- NER实体识别模型,快速高效简单一键部署docker部署调用模型。能识别:地址、人名、机构名实体。☆36Updated last year
- Minimal keyword extraction with BERT☆82Updated 3 years ago
- ChatGLM-6B fine-tuning.☆135Updated 2 years ago
- pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation☆58Updated 7 months ago
- 中文问题句子相似度计算比赛及方案汇总☆300Updated 4 years ago
- LERT: A Linguistically-motivated Pre-trained Language Model(语言学信息增强的预训练模型LERT)☆207Updated 2 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆172Updated 6 years ago
- Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。支持RANDOM、WORD2VEC、FASTTEXT、BERT、ALBERT、ROBERTA、NEZHA、XLNET、ELECTRA…☆323Updated 2 years ago
- 汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型☆136Updated 4 years ago
- 比Sentence-BERT更有效的句向量方案☆371Updated 2 years ago
- 基于sentence-transformers实现文本转向量的机器人☆45Updated 2 years ago
- 时间抽取、 解析、标准化工具☆50Updated 2 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago