dongrixinyu / jiojio
A convenient Chinese word segmentation tool 简便中文分词器
☆46Updated 3 months ago
Related projects ⓘ
Alternatives and complementary repositories for jiojio
- 中文纠错☆91Updated 2 years ago
- 时间抽取、解析、标准化工具☆49Updated 2 years ago
- 中文日期/时间/数字量提取工具☆64Updated 4 years ago
- 一个快速确定文本(新闻)归属地的工具☆18Updated 4 years ago
- 一个基于预训练的句向量生成工具☆132Updated last year
- ☆18Updated 3 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated 9 months ago
- 各大中文分词性能评测☆154Updated 5 years ago
- ChatGLM-6B fine-tuning.☆135Updated last year
- MiniRBT (中文小型预训练模型系列)☆255Updated last year
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated 4 months ago
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- ☆100Updated 4 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆24Updated 9 months ago
- 一个用于训练句子embedding的工具,支持Cosent以及Simcse☆17Updated this week
- 错别字纠正算法。调用pycorrector接口,使用规则。☆66Updated 4 years ago
- 机器学习训练简单模型判定一个句子是不是疑问句☆16Updated 2 years ago
- Time-NLP的Python3版本 中文时间表达识别☆86Updated 4 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆84Updated 6 years ago
- Chinese MobileBERT(中文MobileBERT模型)☆81Updated 2 years ago
- 通用向量搜索服务☆28Updated 2 years ago
- Code for chinese error detection module, using n-gram and bi-lstm☆131Updated 5 years ago
- 中文文本改写☆19Updated 4 years ago
- 在中文开源大模型的基础上进行定制化的微调,拥有自己专属的语言模型。☆44Updated last year
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 4 years ago
- 长文本相似度模型☆16Updated last year
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 中文谐音词/字库(同音词/字)Chinese Homophones☆96Updated 5 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆147Updated 3 years ago
- Minimal keyword extraction with BERT☆75Updated 3 years ago