lsq960124 / Inverted-index-BM25Links
手动实现Elasticsearch的倒排索引以及BM25算法
☆47Updated 6 years ago
Alternatives and similar repositories for Inverted-index-BM25
Users that are interested in Inverted-index-BM25 are comparing it to the libraries listed below
Sorting:
- 李傲龍的博客☆82Updated last year
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 5 years ago
- A full-process dialogue system that can be deployed online☆98Updated 3 years ago
- multi-label,classifier,text classification,多标签文本分类,文本分类,BERT,ALBERT,multi-label-classification☆140Updated 3 years ago
- 基于Bi-GRU + CRF 的中文机构名、人名识别, 支持google bert模型☆167Updated 6 years ago
- 微调预训练语言模型,解决多标签分类任务(可加载BERT、Roberta、Bert-wwm以及albert等知名开源tf格式的模型)☆140Updated 5 years ago
- NER(命名实体识别)中文语料,一站式获取☆130Updated 5 years ago
- 中文文本纠错模型,keras实现☆74Updated 4 years ago
- transformers implement (architecture, task example, serving and more)☆95Updated 3 years ago
- 中国法研杯CAIL2019要素抽取任务第三名方案分享☆138Updated 4 years ago
- Self complemented Pinyin2Chinese demo use algorithms including Trie and HMM model , 基于隐马尔科夫模型与Trie树的拼音切分与拼音转中文的简单demo实现。☆86Updated 7 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆76Updated 5 years ago
- 开课吧&后厂理工学院_百度NLP项目2:试题数据集多标签文本分类 Models: FastText TextCNN GCN BERT et al.☆47Updated 5 years ago
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- 本NER项目包含多个中文数据集,模型采用BiLSTM+CRF、BERT+Softmax、BERT+Cascade、BERT+WOL等,最后用TFServing进行模型部署,线上推理和线下推理。☆81Updated 4 years ago
- Bert分类,语义相似度,获取句向量。☆65Updated 4 months ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- code collections for the book of qna☆121Updated 2 years ago
- Word similarity computation based on Tongyici Cilin☆120Updated 8 years ago
- BERT预训练模型字向量提取工具☆52Updated 5 years ago
- 中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆75Updated 5 years ago
- 一条命令产生bert、albert句向量,用于相似度计算和文本分类等。☆34Updated 2 years ago
- 基于bert进行中文文本纠错☆235Updated 2 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆167Updated 3 years ago
- CCKS2019评测任务五-公众公司公告信息抽取,第3名☆121Updated 5 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译 与构建,基于深度学习的文本蕴含判定模型构建…☆174Updated 6 years ago
- self complemented SpellCorrection based pinyin similairity, edit distance ,基于拼音相似度与编辑距离的查询纠错。☆83Updated 3 years ago
- Mining synonyms from unstructured and semi-structured data☆249Updated 8 months ago
- 基于 Tensorflow,仿 Scikit-Learn 设计的深度学习自然语言处理框架。支持 40 余种模型类,涵盖语言模型、文本分类、NER、MRC、知识蒸馏等各个领域☆116Updated 2 years ago