mengke25 / cnkiLRspiderLinks
知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取
☆37Updated 10 months ago
Alternatives and similar repositories for cnkiLRspider
Users that are interested in cnkiLRspider are comparing it to the libraries listed below
Sorting:
- A small tool for crawling and downloading annual reports from the CNINFO website, and converting them into TXT format for word frequency …☆186Updated last month
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆421Updated last month
- 人民日报爬虫(Python)☆152Updated 6 months ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆170Updated 4 years ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆39Updated 8 months ago
- ☆245Updated last year
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆100Updated 4 years ago
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆154Updated 3 years ago
- 上海证券交易所上市公司定期报告下载,项目地址☆115Updated 9 months ago
- 这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据,没有带标签的是原始数据…☆33Updated 6 months ago
- 巨潮资讯网公告下载☆25Updated 2 years ago
- 澎湃新闻, 新浪新闻,腾讯新闻,搜狐新闻,新闻联播,泰晤士报,纽约时报,BBCNews,旨在爬取所有新闻门户网站的新闻,禁止将所得数据商用!☆430Updated 3 years ago
- BERTopic 中文使用範例☆21Updated last year
- 爬取指定关键词的微博数据☆58Updated last year
- 中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等☆58Updated 4 years ago
- 法律数据挖掘☆21Updated 4 years ago
- 爬取裁判文书网上的文书并进行特征分析和罪名预测☆31Updated 3 years ago
- ChineseDiachronicCorpus,中文历时语料库,横跨六十余年,包括腾讯历时新闻2000-2016,人民日报历时语料1946-2003,参考消息历时语料1957-2002。基于历时流通语料库,可用于历时语言变化计算、语言监测、社会文化变迁研究提供基础性的语料支…☆22Updated 5 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated 4 months ago
- A Chinese financial sentiment word dictionary☆193Updated 4 years ago
- 知乎爬虫,用于爬取问题和对应的回答☆28Updated 2 years ago
- 《Python网络爬虫入门到实战》配套程序。爬虫项目集合,☆35Updated 2 years ago
- 东方财富网股吧爬虫,爬取帖子及其评论的相关信息,并储存到数据库中(附详细操作说明)☆158Updated last month
- 🐛 新浪微博社交网络分析&虚假用户检测。衍生应用:生成个性化新浪微博用户报告。☆110Updated 5 years ago
- 基于人工智能 把 pdf 转 txt(pdf 文字识别)☆19Updated 3 years ago
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆32Updated 3 years ago
- 研报,行业研报,研究报告,每天定时更新☆281Updated last week
- 大模型相关实践记录☆157Updated 9 months ago
- LDA主题模型 | 主题困惑度 | 多文本☆19Updated last year
- 知网论文数据爬虫☆61Updated last year