mengke25 / cnkiLRspider
知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取
☆21Updated last month
Alternatives and similar repositories for cnkiLRspider:
Users that are interested in cnkiLRspider are comparing it to the libraries listed below
- BERTopic 中文使用範例☆15Updated 11 months ago
- CnkiSpider is a package for efficiently crawling articles on CNKI☆21Updated 2 years ago
- 爬取微博关键词相关信息,有远程开发需求可联系,有需要合作加微信: ytouching☆30Updated last month
- 这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据,没有带标签的是原始数据…☆26Updated last year
- 小红书关键词笔记搜索Python 爬虫 (csv保存)☆67Updated last year
- 知网论文数据爬虫☆53Updated last year
- 简单爬取抖音评论中点赞数,用户ID等信息;使用BERT等预训练模型,针对抖音评论进行简单的多分类情感分析任务。☆19Updated 2 years ago
- 基于selenium包,爬取知网关键字检索的论文信息的Python脚本☆27Updated last year
- 一个比较基础、全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆28Updated 8 months ago
- 法律数据挖掘☆19Updated 4 years ago
- 微博热榜爬虫,利用 Github Action 的调度脚本更新 BY PHP☆20Updated this week
- 使用SO_PMI互信息算法、词向量法快速构建 不同领域(手机、汽车等)的专业情感词典☆92Updated 3 years ago
- 研报,行业研报,研究报告,每天定时更新☆112Updated this week
- ✨个人的python代码库(部分)。🌈包涵python基础、各类主流自然语言处理工具接口调用,Keras&Tensortflow实战,数据分析、爬虫等☆11Updated 3 years ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆156Updated 3 years ago
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆100Updated 3 years ago
- ssc-FinLLM-金融大模型☆23Updated 11 months ago
- 基于Python爬虫技术的中国知网(CNKI)文献检索与下载程序,能够便利文献的检索与信息下载!☆14Updated last year
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆29Updated last year
- 中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等☆55Updated 3 years ago
- 基于 PyQt6 开发的 B 站评论爬虫桌面应用,支持评论批量采集、智能管理和数据分析,采用现代化暗色界面设计,提供流畅的用户体验。☆12Updated last month
- 知乎爬虫,用于爬取问题和对应的回答☆28Updated 2 years ago
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆30Updated 2 years ago
- 基于医疗领域知识图谱的问答系统,同时使用了chatGPT、chatGLM4等方式生成医学知识图谱。☆45Updated last year
- A NLP package for Chinese text:Preprocessing, Tokenization, Chinese Fonts, Word Embeddings, Text Similarity and Sentiment Analysis 轻量级中文自…☆25Updated 4 months ago
- 东方财富网股吧爬虫,爬取帖子及其评论的相关信息,并储存到数据库中(附详细操作说明)☆73Updated 2 months ago
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆124Updated 2 years ago
- 上海证券交易所上市公司定期报告下载,项目地址☆91Updated last week
- 本仓库收录了我的毕业论文所使用的全部代码。 毕业论文题目《年报文本语气能预示股价崩盘风险吗?——基于 A 股上市公司年报的文本挖掘》。已被本科生毕业论文相关文献库收录,因此您可以查阅论文的正文 。☆14Updated 3 years ago
- 首个金融领域大模型BloombergGPT 论文的中文实现☆56Updated last year