mmlzhang / cnki_patent
中国知网专利爬虫
☆17Updated 2 years ago
Alternatives and similar repositories for cnki_patent:
Users that are interested in cnki_patent are comparing it to the libraries listed below
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆29Updated 2 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 6 years ago
- 知网爬虫cnkispider,输入关键字爬取知网检索数据☆33Updated 7 years ago
- 专利爬虫,基于request模块的爬虫,保存格式为csv☆12Updated 7 years ago
- 自制Python玩具小爬虫,用来爬取失信被执行人、专利等数据☆19Updated 4 years ago
- 爬取专利信息的爬虫☆27Updated 8 years ago
- Public Behavior Analysis under the COVID-19 Emergency——Based on Weibo Mining☆10Updated 3 years ago
- 基于数据新闻需求,分析openlaw裁判文书的工具。☆43Updated last year