dongrixinyu / jiojio
A convenient Chinese word segmentation tool 简便中文分词器
☆46Updated 3 weeks ago
Alternatives and similar repositories for jiojio:
Users that are interested in jiojio are comparing it to the libraries listed below
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆115Updated 11 months ago
- 中文纠错☆91Updated 2 years ago
- 基于bert进行中文文本纠错☆228Updated last year
- 基于sentence-transformers实现文本转向量的机器人☆46Updated 2 years ago
- 一个基于预训练的句向量生成工具☆133Updated last year
- 在中文开源大模型的基础上进行定制化的微调,拥有自己专属的语言模型。☆46Updated last year
- 时间抽取、解析、标准化工具☆50Updated 2 years ago
- share data, prompt data , pretraining data☆35Updated last year
- Chinese MobileBERT(中文MobileBERT模型)☆84Updated 2 years ago
- pinyintokenizer, 拼音分词器,将连续的拼音切分为单字拼音列表。☆29Updated last week
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- Python3 package for Chinese/English OCR, with paddleocr-v4 onnx model(~14MB). 基于ppocr-v4-onnx模型推理,可实现 CPU 上毫秒级的 OCR 精准预测,通用场景中英文OCR达到开源SO…☆55Updated last week
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆149Updated 3 years ago
- 一个简单易用的 Python 模块,用于通过字符串来操作日期/时间。正则时间提取,字符串时间解析,字符串时间提取。中文时间提取,一句话里面提取时间☆75Updated 6 months ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆48Updated 2 years ago
- ChatGLM-6B fine-tuning.☆135Updated last year
- ☆114Updated 8 months ago
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated 11 months ago
- Time-NLP的Python3版本 中文时间表达识别☆87Updated 4 years ago
- 百度百科 500 万数据集☆33Updated last year
- 一个快速确定文本(新闻)归属地的工具☆18Updated 4 years ago
- Build a Chinese conversational assistant robot with RASA(构建中文多轮任务型对话机器人)☆10Updated 4 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆167Updated 6 years ago
- Pytorch implementation of JointBERT: "BERT for Joint Intent Classification and Slot Filling"☆31Updated last year
- ☆101Updated 4 years ago
- Minimal keyword extraction with BERT☆79Updated 3 years ago
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆25Updated 11 months ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- GoGPT:基于Llama/Llama 2训练的中英文增强大模型|Chinese-Llama2☆78Updated last year