zemengchuan / CnkiSpiderLinks
CnkiSpider is a package for efficiently crawling articles on CNKI
☆20Updated 2 years ago
Alternatives and similar repositories for CnkiSpider
Users that are interested in CnkiSpider are comparing it to the libraries listed below
Sorting:
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆369Updated 3 weeks ago
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆152Updated 2 years ago
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆411Updated 2 years ago
- AGI拓展工具,支持AI搜索&爬虫&数据清洗,开箱即用。tavily、天工、百度百科、百家号、360百科、头条、微信公众号、搜狐百科、腾讯新闻、网易新闻、马蜂窝、小红书☆156Updated 4 months ago
- 中文文本相似度计算器☆160Updated last year
- 知网论文数据爬虫☆58Updated last year
- 夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答…☆360Updated 2 months ago
- 人民日报爬虫(Python)☆143Updated 2 months ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆60Updated last year
- ☆212Updated last year
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆50Updated 3 years ago
- 记录知乎热搜、热门话题、热门视频,每小时更新,按天归档。☆61Updated this week
- 人民日报(1946-2024)、习近平系列重要讲话数据库、古诗文☆68Updated 6 months ago
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆31Updated 7 months ago
- 自己手写的百度搜索接口的封装,pip安装,支持命令行执行。Baidu Search unofficial API for Python with no external dependencies☆150Updated 10 months ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆30Updated 11 months ago
- ☆392Updated 2 months ago
- <数字人文教程>资源合集☆104Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 7 months ago
- 一个巨潮资讯网年报爬取,下载,并将格式转为TXT文本便于词频分析的小工具☆146Updated 6 months ago
- Django 是一个使用 Python 编写的开源 Web 应用程序框架,它提供了一套用于快速开发安全、 可扩展和高效的 Web 应用程序的工具和功能。Django 基于 MVC(Model-View-Controller)架构模式,采用了最佳实践,强调代码的可重用性和可维…☆73Updated last year
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆72Updated 2 years ago
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆129Updated 2 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated last month
- 基于Python爬虫技术的中国知网(CNKI)文献检索与下载程序,能够便利文献的检索与信息下载!☆16Updated 2 years ago
- 一个知乎话题、问题、用户信息的爬虫☆29Updated 4 months ago
- 降AIGC率,降低知网、维普、格子达平台的AIGC检测率,降知网AI,降维普AI,降格子达AI。☆45Updated 2 months ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆165Updated 3 years ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆136Updated last year
- A Chinese NLP library based on BERT for sentiment analysis and general-purpose Chinese word segmentation. | 基于 BERT 的中文 NLP 库,用于中文情感倾向分析、…☆217Updated 2 months ago