moronism189 / chinese-nlp-stepbystep
从jieba分词到BERT-wwm,一步步带你进入中文NLP的世界
☆14Updated 2 years ago
Alternatives and similar repositories for chinese-nlp-stepbystep:
Users that are interested in chinese-nlp-stepbystep are comparing it to the libraries listed below
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated last year
- 基于qlora对baichuan-7B大模型进行指令微调。☆21Updated last year
- 基于向量召回的检索式对话系统解决方案,dense retrieval,FAQ……☆33Updated 3 years ago
- 基于pytorch的百度UIE命名实体识别。☆57Updated 2 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆172Updated 6 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆32Updated 2 years ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆32Updated 4 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆161Updated 3 years ago
- ☆23Updated last year
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆73Updated 4 months ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆31Updated 9 months ago
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆89Updated 4 years ago
- deep training task☆29Updated last year
- LLM for NER☆70Updated 8 months ago
- 中文机器阅读理解数据集☆103Updated 4 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆47Updated 3 years ago
- 介绍docker、docker compose的使用。☆20Updated 7 months ago
- benchmark of KgCLUE, with different models and methods☆27Updated 3 years ago
- experiments of some semantic matching models and comparison of experimental results.☆161Updated last year
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【问答篇】☆21Updated 2 years ago
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆107Updated last year
- 基于 LoRA 和 P-Tuning v2 的 ChatGLM-6B 高效参数微调☆55Updated last year
- 该仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【知识图谱篇】☆20Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆49Updated last month
- Ziya-LLaMA-13B是IDEA基于LLaMa的130亿参数的大规模预训练模型,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。目前姜子牙通用大模型已完成大规模预训练、多任务有监督微调和人类反馈学习三阶段的训练过程。本文主要用于Ziya-…☆45Updated last year
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated last year
- 各大文本摘要模型-中文文本可运行的解决方案☆69Updated last year