AITutorials / datasetsLinks
Integrate AI data sites worldwide!
☆47Updated 3 years ago
Alternatives and similar repositories for datasets
Users that are interested in datasets are comparing it to the libraries listed below
Sorting:
- Share the contribution experience of popular open source projects!☆38Updated 2 years ago
- 自然语言处理(NLP)教程,包括:词向量,词法分析,预训练语言模型,文本分类,文本语义匹配,信息抽取,翻译,对话。☆469Updated 3 years ago
- 深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者。 全书分为15个章节,近20万字。由于水平有限,书中不妥之处恳请广大读者批评指正。 未完待续............ 如有意合作,联系sc…☆266Updated 7 years ago
- 记录本人整理的一些数据集☆1,076Updated 3 years ago
- TextGen: Implementation of Text Generation models, include LLaMA, BLOOM, GPT2, BART, T5, SongNet and so on. 文本生成模型,实现了包括LLaMA,ChatGLM,BLO…☆969Updated last year
- 《Rasa实战:构建开 源对话机器人》官方随书代码 | The official source code of Rasa in Action: Building Open Source Conversational AI☆349Updated 2 years ago
- ☆641Updated 7 months ago
- PromptCLUE, 全中文任务支持零样本学习模型☆664Updated 2 years ago
- Collections of resources from Joint Laboratory of HIT and iFLYTEK Research (HFL)☆375Updated 2 years ago
- PaddleNLP UIE模型的PyTorch版实现☆657Updated 2 years ago
- Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料☆987Updated 3 years ago
- 中文文本分类、序列标注工具包(pytorch),支持中文长文本、短文本的多类、多标签分类任务,支持中文命名实体识别、词性标注、分词、抽取式文本摘要等序列标注任务。 Chinese text classification and sequence labeling toolk…☆350Updated last year
- 自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构,中文分词,词性标注,命名实体识别,新词发现,关键词,文本摘要,文本相似度,科学计算器,中文数字阿拉伯数字(罗马数字)转换,中文繁简转换,拼音转换。tookit(tool) of N…☆664Updated 2 years ago
- Open Language Pre-trained Model Zoo☆1,005Updated 3 years ago
- Collections of Chinese NLP corpus☆911Updated 4 years ago
- 机器阅读理解 冠军/亚军代码及中文预训练MRC模型☆745Updated 2 years ago
- 一键中文数据增强包 ; NLP数据增强、bert数据增强、EDA:pip install nlpcda☆1,869Updated 7 months ago
- 中文聊天小模型,用t5 base在大量数据上有监督。☆101Updated 2 years ago
- a bert for retrieval and generation☆861Updated 4 years ago
- ☆89Updated 2 years ago
- 天池中药说明书实体识别挑战冠军方案;中文命名实体识别;NER; BERT-CRF & BERT-SPAN & BERT-MRC;Pytorch☆961Updated 4 years ago
- 面向中文自然语言处理的六十余类实践项目及学习索引,涵盖语言资源构建、社会计算、自然语言处理组件、知识图谱、事理图谱、知识抽取、情感分析、深度学习等几个学习主题。包括作者个人简介、学习心得、语言资源、工业落地系统等,是供自然语言处理入门学习者的一个较为全面的学习资源,欢迎大家…☆419Updated 4 months ago
- 自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT句向量-相似度(Sentence Similarity),XLNET句向量-相似度(text xlnet embedding),文本分类(Text classification), 实体提取(ner,b…☆1,534Updated 4 years ago
- An implementation of the BERT model and its related downstream tasks based on the PyTorch framework. @月来客栈☆607Updated 3 months ago
- 基于金融-司法领域(兼有闲聊性质)的聊天机器人,其中的主要模块有信息抽取、NLU、NLG、知识图谱等,并且利用Django整合了前端展示,目前已经封装了nlp和kg的restful接口☆1,297Updated 4 years ago
- 高质量中文预训练模型集合:最先进大模型、最快小模型、相似度专门模型☆817Updated 5 years ago
- Some Cool NLP and CV Repositories and Solutions (收集NLP中常见任务的开源解决方案、数据集、工具、学习资料等)☆163Updated 4 years ago
- ☆441Updated 6 months ago
- 自然语言处理学习笔记:机器学习及深度学习原理和示例,基于 Tensorflow 和 PyTorch 框架,Transformer、BERT、ALBERT等最新预训练模型及源代码详解,及基于预训练模型进行各种自然语言处理任务。模型部署☆442Updated 5 years ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆647Updated 2 years ago