zemengchuan / CnkiSpiderLinks
CnkiSpider is a package for efficiently crawling articles on CNKI
☆20Updated 2 years ago
Alternatives and similar repositories for CnkiSpider
Users that are interested in CnkiSpider are comparing it to the libraries listed below
Sorting:
- 中文文本相似度计算器☆166Updated last year
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆74Updated 9 months ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆425Updated 3 years ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆417Updated last month
- 基于论文摘要的文本分类与关键词抽取挑战赛—Task 1☆23Updated 2 years ago
- 人民日报爬虫(Python)☆152Updated 5 months ago
- 古诗词爬虫和文本挖掘,含13个朝代的3万多条诗人数据、85万多条诗词数据,包括主题聚类、相关诗词推荐、藏头诗生成、诗词翻译等算法实现☆32Updated 3 years ago
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆35Updated 10 months ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆64Updated last year
- 知网论文数据爬虫☆61Updated last year
- 中文 NLP 资源库,语料库,相关的框架,文章收集。☆27Updated 3 years ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆138Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 9 months ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆653Updated 2 years ago
- 夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答…☆366Updated 4 months ago
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆159Updated 2 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆102Updated 2 years ago
- ☆403Updated 5 months ago
- 基于bert-base-chinese微调的中文情感分析任务,在WeiboSenti100k 数据集上训练5个epoch并且收敛☆39Updated 2 years ago
- 大模型相关实践记录