mmlzhang / cnki_patent
中国知网专利爬虫
☆18Updated 2 years ago
Alternatives and similar repositories for cnki_patent:
Users that are interested in cnki_patent are comparing it to the libraries listed below
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆30Updated 2 years ago
- 自制Python玩具小爬虫,用来爬取失信被执行人、专利等数据☆20Updated 4 years ago
- 法律数据挖掘☆19Updated 4 years ago
- 本仓库收录了我的毕业论文所使用的全部代码。 毕业论文题目《年报文本语气能预示股价崩盘风险吗?——基于 A 股上市公司年报的文本挖掘》。已被本科生毕业论文相关文献库收录,因此您可以查阅论文的正文。☆14Updated 3 years ago
- 专利爬虫,基于request模块的爬虫,保存格式为csv☆11Updated 7 years ago
- ☆28Updated 2 years ago
- Code Repository for MS20190155☆147Updated last year
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆100Updated 3 years ago
- 知网爬虫cnkispider,输入关键字爬取知网检索数据☆34Updated 7 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- 南京大学2019年“计算社会科学”论文工作坊☆14Updated 5 years ago
- 裁判文书数据-增量更新☆39Updated 4 years ago
- 爬取谷歌专利☆9Updated 5 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。 首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 7 years ago
- This repository provides the replication code and data for Kogan, L., Papanikolaou, D., Seru, A. and Stoffman, N., QJE 2017.☆33Updated 3 years ago
- 爬取专利信息的爬虫☆26Updated 8 years ago
- 基于数据新闻需求,分析openlaw裁判文书的工具。☆47Updated last year
- 微博爬取“关键词”的程序,并作出了各种优化☆22Updated last year
- 《基本有用的计量经济学》(MUSE)☆120Updated 3 years ago
- 利用scrapy框架爬取了好大夫网站上全国的医院信息(省市、医院名称、级别、类型、部门数量、医生数量、联系电话等)、各省市每个医院的部门信息(所属医院、部门名称、部门简介、部门医生数量等)和每个医院的医生信息(所 属医院及部门、姓名、职称、热度、专业技能等),并分别存入mys…☆25Updated 4 years ago
- ☆11Updated 2 years ago
- ☆30Updated 3 years ago
- The crawler for data on web of science, especially focus on the analysis of citation data☆14Updated 6 years ago
- Stata连享会推文集锦☆69Updated 2 years ago
- 中文文本挖掘lda模型,gensim+jieba库☆17Updated 5 years ago
- 用python判断微博用户的影响力☆52Updated 9 years ago
- 基于知乎文本数据的lda和word2vec模型☆16Updated 4 years ago
- 非结构化课程作业,包括社交网络、链路预测、数据流、文本分析☆23Updated 6 years ago
- The do file for this repository will go a long way to eliminate the fear of choice when selecting control variables.☆25Updated 2 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆38Updated 5 years ago