zemengchuan / CnkiSpiderLinks
CnkiSpider is a package for efficiently crawling articles on CNKI
☆21Updated 2 years ago
Alternatives and similar repositories for CnkiSpider
Users that are interested in CnkiSpider are comparing it to the libraries listed below
Sorting:
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆430Updated 3 years ago
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆166Updated 2 years ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆423Updated 2 months ago
- 知网论文数据爬虫☆61Updated 2 years ago
- ☆246Updated last year
- 中文文本相似度计算器☆168Updated last year
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆37Updated 11 months ago
- 基于论文摘要的文本分类与关键词抽取挑战赛—Task 1☆23Updated 2 years ago
- 携程评论爬虫,使用线程池来爬取热门景区评论,简单易用。一键爬取任意省的所有热门景区并分析评论数据,可视化展示。☆143Updated 8 months ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆50Updated 3 years ago
- AGI拓展工具,支持AI搜索&爬虫&数据清洗,开箱即用。tavily、天工、百度百科、百家号 、360百科、头条、微信公众号、搜狐百科、腾讯新闻、网易新闻、马蜂窝、小红书☆168Updated 8 months ago
- An AI-powered content conversion tool that transforms text, web content, or HTML code into beautifully designed card images.一款基于AI的内容转换工…☆33Updated 6 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆139Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 10 months ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆64Updated last year
- 自己手写的百度搜索接口的封装,pip安装,支持命令行执行。Baidu Search unofficial API for Python with no external dependencies☆157Updated last year
- 基于Python爬虫技术的中国知网(CNKI)文献检索与下载程序,能够便利文献的检索与信息下载!☆16Updated 2 years ago
- 夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答…☆366Updated 6 months ago
- 大模型相关实践记录☆158Updated 9 months ago
- 人民日报爬虫(Python)☆157Updated 6 months ago
- ☆410Updated 6 months ago
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆80Updated 10 months ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆661Updated 2 years ago
- 爬取指定关键词的微博数据☆58Updated last year
- LDA主题模型 | 主题困惑度 | 多文本☆19Updated last year
- 爬取裁判文书网上的文书并进行特征分析和罪名预测☆31Updated 3 years ago
- selenium裁判文书网爬虫,文书网登录☆41Updated 3 years ago
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆75Updated 2 years ago
- <数字人文教程>资源合集☆111Updated last year
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆580Updated 3 years ago