yongzhuo / Tookit-Sihui
Tookit-Sihui, a tool of some common algorithm, AI文本混合科学计算器(calculator-sihui), 句子词频-逆文本频率(TF-IDF),搜索BM25, 前缀树搜索关键词(trietree), 模板匹配-递归函数(func_recursive),中文数字转阿拉伯数字(chinese to number),阿拉伯数字转汉语数字, HMM, CRF
☆24Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for Tookit-Sihui
- Quick run NLP in many task 快速运行分类、序列标注、匹配、生成等NLP任务的Tensorflow框架 (中文 NLP 支持分布式)☆30Updated 3 years ago
- 千言多技能对话,包含 闲聊、知识对话、推荐对话☆27Updated 3 years ago
- 实体识别和信息抽取☆18Updated 5 years ago
- AC自动机python的实现,并进行了优化。 主要修复了 查询不准确的问题。☆70Updated 3 years ago
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- 多轮对话槽填充☆19Updated 5 years ago
- ☆18Updated last year
- 使用tf实现最新的中文命名实体识别模型☆14Updated 4 years ago
- NLP的数据增强Demo☆47Updated 4 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 4 years ago
- 天池-新冠疫情相似句对判定大赛 Rank8☆52Updated 4 years ago
- 2020语言与智能技术竞赛:关系抽取任务(https://aistudio.baidu.com/aistudio/competition/detail/31?lang=zh_CN)☆25Updated 4 years ago
- 使用python实现了一个简单的trie树结构,可增加/查找/删除关键词,用于中文文本的关键词匹配、停用词删除等。☆65Updated 4 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆79Updated 2 years ago
- 2018-“AIIA”杯-国家 电网-电力专业领域词汇挖掘:5st/451☆24Updated 5 years ago
- 天池-新冠疫情相似句对判定大赛 大白_Rank6☆22Updated 4 years ago
- CCF-BDCI大数据与计算智能大赛-互联网金融新实体发现-9th☆54Updated 4 years ago
- 开天-新词,中文新词发现工具,Chinese New Word Discovery Tool☆20Updated 4 years ago
- 基于rasa_框架实现指自然语言相关功能:实体识别、文本分类、代消解功能、关系抽取等☆17Updated last year
- CNN、BiLSTM、Bert(3layers)对Bert(12layers)模型的蒸馏的keras实现☆27Updated 4 years ago
- 企业事件抽取☆14Updated 3 years ago
- 适用于常见的NLP任务的模板☆34Updated last year
- 2019 语言与智能技术竞赛-知识驱动对话 B榜第5名源码和模型☆27Updated 5 years ago
- 2019 语言与智能技术竞赛-知识驱动对话 B榜第5名源码和模型☆25Updated 4 years ago
- 达观算法比赛ner任务,从重新训练bert,到finetune预测。☆76Updated 2 years ago
- 2020语言与智能技术竞赛:关系抽取任务☆11Updated 4 years ago
- 一条命令产生bert、albert句向量,用于相似度计算和文本分类等。☆34Updated last year
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 4 years ago