zemengchuan / CnkiSpiderLinks
CnkiSpider is a package for efficiently crawling articles on CNKI
☆20Updated 2 years ago
Alternatives and similar repositories for CnkiSpider
Users that are interested in CnkiSpider are comparing it to the libraries listed below
Sorting:
- 澎湃新闻,新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆411Updated 3 years ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆384Updated this week
- 中文文本相似度计算器☆162Updated last year
- 常用中文停用词表:包含百度停用词表、哈工大停用词表和四川大学机器智能实验室停用词表。还有整理过的英文停用词表以及其他语言的停用词表☆154Updated 2 years ago
- 中文 NLP 资源库,语料库,相关的框架,文章收集。☆28Updated 3 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 8 months ago
- AGI拓展工具,支持AI搜索&爬虫&数据清洗,开箱即用。tavily、天工、百度百科、百家号、360百科、头条、微信公众号、搜狐百科、腾讯新闻、网易新闻、马蜂窝、小红书☆161Updated 5 months ago
- 知网论文数据爬虫☆60Updated last year
- bilibili弹幕分析,包 含爬虫、词云分析、词频分析、情感分析、构建衍生指标,可视化☆174Updated 2 years ago
- 人民日报爬虫(Python)☆147Updated 4 months ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆50Updated 3 years ago
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆32Updated last year
- 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、正负情感分析。Text analysis, supporting multiple methods including word count, readability, document simil…☆572Updated 2 years ago
- ☆223Updated last year
- 一个新闻政策类爬虫项目,实现上万网站的实时监控、爬取、过滤、存储,具有高可用性和可扩展性。☆37Updated 3 years ago
- 夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答…☆361Updated 3 months ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆213Updated 2 years ago
- Your all-in-one port for papers, citations, and research insights.☆111Updated 4 months ago
- 爬取指定关键词的微博数据☆58Updated last year
- 这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行 情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据,没有带标签的是原始数据…☆31Updated 4 months ago
- 基于论文摘要的文本分类与关键词抽取挑战赛—Task 1☆23Updated 2 years ago
- 自己手写的百度搜索接口的封装,pip安装,支持命令行执行。Baidu Search unofficial API for Python with no external dependencies☆153Updated last year
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated 2 months ago
- An AI-powered content conversion tool that transforms text, web content, or HTML code into beautifully designed card images.一款基于AI的内容转换工…☆32Updated 3 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆139Updated last year
- 爬取bilibili视频下的评论,最新出品!!!⚠本代码只适用于学习,做其他事情概不负责!!!☆65Updated 3 months ago
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆72Updated 2 years ago
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆33Updated 8 months ago
- 上海证券交易所上市公司定期报告下载,项目地址☆113Updated 7 months ago
- 💼法律AI助手,法律RAG,通过全部200+本法律手册📖、网页搜索内容💻结合LLM回答你的问题,并且给出相应的法规和网站,基于⚡️ langchain,Gradio,openai,chroma,duckduckgo-search☆181Updated last year