JiangYanting / Chinese_book_datasetLinks
中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/
☆89Updated 3 months ago
Alternatives and similar repositories for Chinese_book_dataset
Users that are interested in Chinese_book_dataset are comparing it to the libraries listed below
Sorting:
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆51Updated 3 months ago
- 中文心理问答数据集☆75Updated 5 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆66Updated 4 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆113Updated 6 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆32Updated 2 years ago
- 本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。☆28Updated 2 months ago
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- 金庸小说人物关系图谱构建☆61Updated 5 years ago
- 各大文本摘要模型-中文文本可运行的解决方案☆68Updated last year
- 中文、分词 、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆164Updated 3 years ago
- 中文纠错☆92Updated 3 years ago
- 维基百科中文语料整理☆296Updated 7 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆23Updated last year
- 中文聊天小模型,用t5 base在大量数据上有监督。☆100Updated last year
- The most complete Chinese dictionaries ever. 史上最全的中文分类词库,包含地理信息、电子游戏、工程应用、农林牧渔、人文科学、社会科学、生活百科、医学医药、艺术设计、娱乐休闲、运动休闲、自然科学等12大类的超级字典。☆78Updated 5 years ago
- 中文PDF转TXT的实用工具☆30Updated 3 years ago
- FAQ智能问答系统。实现FAQ的问题-模板匹配功能。部署轻量级的Web服务应用。☆61Updated 10 months ago
- A Multi-Modal Dataset of Chinese Governmental Docunments☆34Updated 4 years ago
- 国内首个全参数训练的法律大模型 HanFei-1.0 (韩非)☆116Updated last year
- 自然语言处理NLP(自然语言生成NLG、自然语言理解NLU)、自然语言学术会议大盘点、自然语言大佬介绍、NLP研究机构、NLP资料分享、NLP学习资源分享、NLP学术论文介绍☆185Updated 3 months ago
- tensorflow+bert+seq2seq 周公解梦。AI遇上玄学,说出你的梦境(dream),模型自动解析decode梦境的征兆。类似聊天机器人(chatbot,QA),你问我答。☆129Updated 5 years ago
- NLU & NLG (zero-shot) depend on mengzi-t5-base-mt pretrained model☆74Updated 2 years ago
- "桃李“: 国际中文教育大模型☆181Updated last year
- 文本智能校对大赛(Chinese Text Correction)的baseline☆67Updated 2 years ago
- 零样本学习测评基准,中文版☆56Updated 3 years ago
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…