lsq960124 / Inverted-index-BM25
手动实现Elasticsearch的倒排索引以及BM25算法
☆45Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for Inverted-index-BM25
- NLP tools, word segmentation, sentence segmentation, New-Word-Discovery,新词发现☆24Updated 9 months ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆48Updated 4 years ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 4 years ago
- Bert预训练模型fine-tune计算文本相似度☆97Updated last year
- Bert中文文本分类☆40Updated 5 years ago
- CCF BDCI 金融信息负面及主体判定 冠军代码☆106Updated 4 years ago
- WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation based on online bake knowledge base and semantic embedding similarit…☆124Updated 5 years ago
- 达观算法比赛ner任务,从重新训练bert,到finetune预测。☆76Updated 2 years ago
- 文本分类的目前测试效果较好的算法☆56Updated 5 years ago
- NLP的数据增强Demo☆47Updated 4 years ago
- 中文文本纠错模型,keras实现☆70Updated 3 years ago
- 基于检索的任务型多轮对话☆78Updated 4 years ago
- 该部分停止更新,升级项目地址:https://github.com/we-chatter/chatbot_utils☆34Updated last year
- 使用BERT模型进行文本分类,相似句子判断,以及词性标注☆87Updated 5 years ago
- 基于ltp的简单评论观点抽取模块☆117Updated 5 years ago
- 基于轻量级的albert实现albert+BiLstm+CRF☆88Updated last year
- 专业领域词库构建/中文新词发现/专业词库发现☆28Updated 4 years ago
- 发现新词 无监督词库生成 医学词库生成 发现未登录词☆77Updated 3 years ago
- 2019百度语言与智能技术竞赛信息抽取赛代5名代码☆69Updated 5 years ago
- NER(命名实体识别)中文语料,一站式获取☆126Updated 5 years ago
- 使用ALBERT预训练模型,用于识别文本中的时间,同时验证模型的预测耗时是否有显著提升。☆56Updated 4 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆72Updated 4 years ago
- 李傲龍的博客☆81Updated 3 months ago
- 基于意图识别和命名实体识别的多轮对话场景设计☆36Updated 5 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆138Updated 4 years ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆78Updated 3 years ago
- CCKS 2019 Task 2: Entity Recognition and Linking☆95Updated 5 years ago
- 中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆74Updated 4 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆140Updated 3 years ago