JiangYanting / Chinese_book_dataset
中文图书数据集/数据挖掘/自然语言处理/中国图书分类法/图书情报学/数据挖掘/文本分类/
☆87Updated last month
Alternatives and similar repositories for Chinese_book_dataset:
Users that are interested in Chinese_book_dataset are comparing it to the libraries listed below
- 中文心理问答数据集☆75Updated 4 years ago
- Chinese Classic Poem Mining Project including corpus buiding by spyder and content analysis by nlp methods, 基于爬虫与nlp的中国古代诗词文本挖掘项目☆113Updated 6 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆161Updated 3 years ago
- 金庸小说人物关系图谱构建☆61Updated 5 years ago
- 中文纠错☆92Updated 3 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆49Updated last month
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆204Updated last year
- 各大中文分词性能评测☆157Updated 6 years ago
- 本项目用于文档问答,使用向量嵌入 + ES 做召回,使用Rerank模型作为精排,再使用LLM做文档问答,Web框架使用Flask。☆25Updated last month
- 维基百科中文语料整理☆296Updated 7 years ago
- pytorch-based, RNN,中文古诗词、歌词、散文自动生成☆57Updated 5 years ago
- 专注于中文领域大语言模型,落地到某个行业某个领域,成为一个行业大模型、公司级别或行业级别领域大模型。☆118Updated last month
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆71Updated 4 years ago
- QBQTC: 大规模搜索匹配数据集☆79Updated 3 years ago
- clueai工具包: 3行代码3分钟,自定义需要的API!☆233Updated last year
- Poetry-related datasets developed by THUAIPoet (Jiuge) group.☆226Updated 5 years ago
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated last year
- 渊 - A project for Classical Chinese☆103Updated 3 years ago
- FAQ智能问答系统。实现FAQ的问题-模板匹配功能。部署轻量级的Web服务应用。☆61Updated 8 months ago
- ☆23Updated last year
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- Chinese Couplets Dataset without vulgar words. 不包含敏感内容的对联数据集。☆73Updated 5 years ago
- 基于火力发电厂知识问答库的检索式问答系统/问答系统/对话系统☆53Updated 4 years ago
- tensorflow+bert+seq2seq 周公解梦。AI遇上玄学,说出你的梦境(dream),模型自动解析decode梦境的征兆。类似聊天机器人(chatbot,QA),你问我答。☆128Updated 5 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆65Updated 4 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- ChineseHumorSentiment, chinese humor sentiment mining including corpus build and mining nlp methods.中文文本幽默情绪计算项目,项目包括幽默文本语料库的构建,幽默计算模型,包括…☆122Updated 6 years ago
- 基于qlora对baichuan-7B大模型进行指令微调。☆21Updated last year
- 文本对关系比较 - 语义相似度、字面相似度、文本蕴含等等☆55Updated 5 years ago
- 手动实现Elasticsearch的倒排索引以及BM25算法☆47Updated 6 years ago