Kawabata0223 / Programs-Based-on-SnowNLP_ZUELer
本项目为中南财经政法大学统数学院“基于大语言模型的网络舆情态势感知研究——舆情评论的群体情绪与语义标签化分析”项目中期研究进展情况的部分程序文件
☆11Updated 8 months ago
Alternatives and similar repositories for Programs-Based-on-SnowNLP_ZUELer:
Users that are interested in Programs-Based-on-SnowNLP_ZUELer are comparing it to the libraries listed below
- 这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据,没有带标签的是原始数据…☆24Updated last year
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆62Updated 4 years ago
- 基于SnowNLP的三百万电影数据的影评情感预测☆11Updated 4 years ago
- 本仓库收录了我的毕业论文所使用的全部代码。 毕业论文题目《年报文本语气能预示股价崩盘风险吗?——基于 A 股上市公司年报的文本挖掘》。已被本科生毕业论文相关文献库收录,因此您可以查阅论文的正文。☆14Updated 3 years ago
- 知识图谱2022秋冬课程设计☆7Updated 2 years ago
- 基于知乎文本数据的lda和word2vec模型☆16Updated 4 years ago
- 大模型相关实践记录☆136Updated 2 months ago
- 《自然语言理解与行业知识图谱-概念、方法与工程落地》 一书中介绍的各个章节的算法展示代码☆13Updated 8 months ago
- 基于PaddleNLP搭建评论观点抽取和属性级情感分析模型,并基于前后端分离式架构完成属性级情感分析Web系统搭建,通过细粒度情感分析帮助用户和商家更好决策。☆65Updated last year
- 基于机器学习的信用风险评估模型,主要使用了Sklearn库,通过逻辑回归,向量机等模型,根据借款人的个人身份信息评估是否应当发放贷款。☆14Updated 2 years ago
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆41Updated 2 years ago
- 智能供应链分析,对顾客用rfm模型分类,用多种机器学习模型建模,进行欺诈订单预测,延迟发货预测,销售额预测,销售数量预测☆30Updated 4 years ago
- BERTopic 中文使用範例☆12Updated 10 months ago
- 使用了多种主流的文本深度学习模型进行了中文商品金融文本的精细化分类和情感分类,可用于对商品评价进行量化分析☆9Updated last year
- 基于 RoBERTa-wwm-ext 模型的微博中文情绪识别☆33Updated 3 years ago
- 情感分析,微博情感分析,微博水军检测,水军检测,营销粉检测,僵尸粉检测,微博爬虫☆67Updated 4 years ago
- 计算社会学,爬虫,机器学习,情感分析,疫情舆论☆20Updated 4 years ago
- 基于bert-base-chinese微调的中文情感分析任务,在WeiboSenti100k 数据集上训练5个epoch并且收敛☆33Updated last year
- Python3数据分析与挖掘建模实战 学习代码☆18Updated 6 years ago
- 基于SEIR传染病模型的延伸建模,加入了死亡人群,构建基本的SEIDR模型,加入疫苗影响、政府管控、病毒变异等因素,在原模型的基础上进行延伸☆17Updated last year
- 知乎爬虫,用于爬取问题和对应的回答☆28Updated 2 years ago
- 对豆瓣影评进行文本分类情感分析,利用爬虫豆瓣爬取评论,进行数据清洗,分词,采用BERT、CNN、LSTM等模型进行训练,采用tensorboardX可视化训练过程,自然语言处理项目\A project for text classification, based on to…☆136Updated last year
- 数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)☆18Updated 4 years ago
- 该资源将应用人工智能技术研究水族文化、文字和古籍。为更好的抢救和保护濒危水族文字和非物质文化遗产,作者申请并开源了该项目,主要通过人工智能技术识别水书,构建与汉字的自动翻译系统,实现水族本体和文献知识图谱构建,挖掘新词并溯源民族变迁历史。作者回到家乡贵州教书以来,对利用AI…☆40Updated 9 months ago
- Datawhale自研数据标注工具☆66Updated 9 months ago
- 元胞自动机模拟病毒传染(SEIR模型)可视化☆30Updated 4 years ago
- 一个比较基础、全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆28Updated 7 months ago
- 使用bert进行事件抽取。☆43Updated last year
- THUCNews中文文本分类数据集的处理,该数据集包含84万篇新闻文档,总计14类;在数据集的基础上可以进行文本分类、词向量的训练等任务。☆16Updated 4 years ago
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆30Updated 2 years ago