JiangYanting / Chinese_book_dataset
中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/
☆87Updated 3 weeks ago
Alternatives and similar repositories for Chinese_book_dataset:
Users that are interested in Chinese_book_dataset are comparing it to the libraries listed below
- 中文心理问答数据集☆75Updated 4 years ago
- pytorch-based, RNN,中文古诗词、歌词、散文自动生成☆57Updated 5 years ago
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆32Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆48Updated 3 weeks ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- Chinese Couplets Dataset without vulgar words. 不包含敏感内容的对联数据集。☆72Updated 5 years ago
- 本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。☆25Updated 2 weeks ago
- 基于向量召回的检索式对话系统解决方案,dense retrieval,FAQ……☆33Updated 3 years ago
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆112Updated 6 years ago
- ChineseHumorSentiment, chinese humor sentiment mining including corpus build and mining nlp methods.中文文本幽默情绪计算项目,项目包括幽默文本语料库的构建,幽默计算模型,包括…☆119Updated 6 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆21Updated last year
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆159Updated 3 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆155Updated 5 months ago
- 使用pyltp的工具,基于中文依存句法的四大名著人物情节分析系统。分为整体分析和章节分析两大模块,实现了人物篇幅分析,故事发生地分析,主要人物情绪变化分析,人物互动情况分析.☆92Updated 7 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆63Updated 4 years ago
- 百度百科爬虫☆71Updated 9 months ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆233Updated last year
- 金庸和古龙之间的文本风格转换☆26Updated 2 years ago
- 各大中文分词性能评测☆157Updated 6 years ago
- RelExt: A Tool for Relation Extraction from Text. 文本实体关系抽取工具。☆50Updated 2 years ago
- 用BERT在百度WebQA中文问答数据集上做阅读问答☆65Updated 5 years ago
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- NLU & NLG (zero-shot) depend on mengzi-t5-base-mt pretrained model☆75Updated 2 years ago
- 基于文本相似度的win10智能客服问答系统☆15Updated 5 years ago
- 错别字纠正算法。调用pycorrector接口,使用规则。☆68Updated 5 years ago
- 各大文本摘要模型-中文文本可运行的解决方案☆67Updated last year
- 中文纠错☆92Updated 3 years ago
- tensorflow+bert+seq2seq 周公解梦。AI遇上玄学,说出你的梦境(dream),模型自动解析decode梦境的征兆。类似聊天机器人(chatbot,QA),你问我答。☆125Updated 5 years ago
- Unilm for Chinese Chitchat Robot.基于Unilm模型的夸夸式闲聊机器人项目。☆157Updated 4 years ago