mmlzhang / cnki_patent
中国知网专利爬虫
☆17Updated last year
Related projects: ⓘ
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆23Updated 2 years ago
- 专利爬虫,基于request模块的爬虫,保存格式为csv☆12Updated 7 years ago
- 自制Python玩具小爬虫,用来爬取失信被执行人、专利等数据☆18Updated 4 years ago
- 爬取专利信息的爬虫☆27Updated 7 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆102Updated 6 years ago
- ☆17Updated this week
- 知网爬虫cnkispider,输入关键字爬取知网检索数据☆30Updated 6 years ago
- The crawler for data on web of science, especially focus on the analysis of citation data☆13Updated 5 years ago
- Public Behavior Analysis under the COVID-19 Emergency——Based on Weibo Mining☆10Updated 3 years ago
- 爬取谷歌专利☆8Updated 5 years ago
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆95Updated 2 years ago
- 用python判断微博用户的影响力☆51Updated 8 years ago
- 裁判文书数据-增量更新☆37Updated 4 years ago
- 南京大学《数据新闻》2017 周一 第3-4节 逸B-210 1-18周☆16Updated 5 years ago
- 情感分析,微博情感分析,微博水军检测,水军检测,营销粉检测,僵尸粉检测,微博爬虫☆63Updated 3 years ago
- ☆48Updated this week
- 以“工会维权”为主题的文献计量研究 | Bibliometrics Research on Trade Unions' Rights Protection☆32Updated 6 years ago
- 专利信息及全文下载☆17Updated last year
- This repository is used to provide some useful data file and do file of Stata to reader.☆35Updated 5 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆86Updated 2 years ago
- 微博爬取“关键词”的程序,并作出了各种优化☆21Updated last year
- 中国知网爬虫☆141Updated 7 years ago
- 数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)☆16Updated 3 years ago
- 《计算新闻传播学》课程☆105Updated 2 years ago
- 《社交网络上的计算传播学》配套PPT☆15Updated 5 years ago
- 非结构化课程作业,包括社交网络、链路预测、数据流、文本分析☆21Updated 5 years ago
- ☆20Updated 6 years ago
- 陈强高级计量经济学笔记,使用python、matlab实现各模型估计☆106Updated 4 years ago
- This repository provides the replication code and data for Kogan, L., Papanikolaou, D., Seru, A. and Stoffman, N., QJE 2017.☆26Updated 3 years ago