数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图
☆77Dec 14, 2023Updated 2 years ago
Alternatives and similar repositories for DataScienceAssignment
Users that are interested in DataScienceAssignment are comparing it to the libraries listed below
Sorting:
- 客户价值聚类分析☆15Feb 7, 2018Updated 8 years ago
- Apply ML on weibo sentiment. 疫情背景下微博文本情感分析与可视化☆46Mar 12, 2026Updated last week
- 使用python抓取微博数据并对微博文本分析和可视化,LDA(树图)、关系图、词云、时间趋势(折线图)、热度地图、词典情感分析(饼图和3D柱状图)、词向量神经网络情感分析、tfidf聚类、词向量聚类、关键词提取、文本相似度分析等☆948Aug 28, 2020Updated 5 years ago
- 爬取新浪微博数据并可视化分析☆41Mar 16, 2021Updated 5 years ago
- 微博爬虫(可基于搜索关键词,爬取博文),对博文数据清洗,并利用百度aip情感分析(三分类)。repo曾用于2022学创杯省赛☆16Feb 10, 2022Updated 4 years ago
- 非结构化课程作业,包括社交网络、链路预测、数据流、文本分析☆24Mar 18, 2019Updated 7 years ago
- 1.1问题背景 在电影行业飞速发展的当今,电影已经成为了非常普遍的娱乐选择,中国电影最近几年也是突飞猛进,越来越多的人走进电影院。而信息媒体的发展也使得所有人都拥有了随时随地 与世界各地的人讨论电影的机会,电影无疑已经进入了全民关注,全民讨论时代。 但是随着越来越多的电影上映…☆18Aug 6, 2019Updated 6 years ago
- 根据关键词爬取微博内容并进行情感分析☆16Mar 18, 2020Updated 6 years ago
- 针对微博平台的微博文本数据进行舆情分析项目,内容有微博爬虫、LDA主题分析和情感分析☆75Mar 4, 2023Updated 3 years ago
- 微博情感分类数据集+爬虫+句嵌入+情感分类+作图☆26Dec 31, 2024Updated last year
- 酒店评论文本分类聚类私活☆11Jan 18, 2019Updated 7 years ago
- 天猫商城洗发水商品top10的评论情感分析☆11Aug 13, 2016Updated 9 years ago
- svm 情感分析☆16Jun 28, 2018Updated 7 years ago
- 基于Python Flask Web的B/S学生信息管理系统☆16Feb 23, 2022Updated 4 years ago
- ☆14Jun 13, 2022Updated 3 years ago
- 豆瓣探索者这个作品是依托豆瓣这个平台制作的一个数据分析系统。本作品使用Python的BeautifulSoup库爬取了电影、图书、音乐这三个方向的数据存入MongoDB的NoSQL数据库,使用Pyecharts库得到了诸如单部电影评分分布的一维数据图、评分与评论数关系的二维…☆86Apr 4, 2021Updated 4 years ago
- 基于Hadoop的好友推荐系统☆11Nov 20, 2017Updated 8 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆123Mar 31, 2019Updated 6 years ago
- boss直聘爬虫,boss,招聘,数据可视化,pyecharts,selenium ,xpath☆26Dec 4, 2020Updated 5 years ago
- 利用python分析爬取的中国电影票房数据并可视化Chinese-box-office-analysis☆17Apr 6, 2023Updated 2 years ago
- 豆瓣电影数据分析☆13Aug 28, 2023Updated 2 years ago
- 大模型相关实践记录☆158Apr 6, 2025Updated 11 months ago
- 使用scrapy框架爬取豆瓣影评,利用python对数据进行清洗分析,最后进行可视化☆15Sep 5, 2020Updated 5 years ago
- Code for Findings of EMNLP 2022 short paper "CDGP: Automatic Cloze Distractor Generation based on Pre-trained Language Model".☆14May 22, 2023Updated 2 years ago
- 基于selenium的携程酒店评论爬取☆13May 10, 2021Updated 4 years ago
- 机器学习:knn算法实现分类,计算准确率(鸢尾花数据集)☆15Oct 12, 2019Updated 6 years ago
- 基于关键字的配置化电商爬虫,目前已实现京东和苏宁(淘宝反爬太严重,因为没有使用selenium)☆12Jun 3, 2020Updated 5 years ago
- 微博评论情感分析,爬虫,文本分类,Web。☆46Nov 13, 2025Updated 4 months ago
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆33Jul 4, 2022Updated 3 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆31Nov 11, 2020Updated 5 years ago
- Crawl weibo's comments, plot wordcloud and analyze text emotion; 爬取微博评论,并画出词云,分析评论的文本情感☆54Aug 13, 2019Updated 6 years ago
- 抖音相关爬虫☆10Feb 24, 2022Updated 4 years ago
- 字节跳动青训营大作业☆11Feb 27, 2023Updated 3 years ago
- 微博情感分析,文本分类,毕业设计项目☆1,079Apr 23, 2020Updated 5 years ago
- python爬取前程无忧33751个python岗位数据, 并进行可视化分析☆38Mar 26, 2020Updated 5 years ago
- 获取微博搜索结果信息,搜索即可以是微博关键词搜索,也可以是微博话题搜索☆15Oct 20, 2022Updated 3 years ago
- B站弹幕、评论爬虫+词云生成☆52Jun 26, 2020Updated 5 years ago
- 该爬虫爬取拉勾网用户想要查询的地区的python相关招聘信息,并且进行数据处理与分析可视化。☆14Oct 24, 2018Updated 7 years ago
- 以中国新闻网社会新闻板块为抓取对象,通过关键词来分析新闻热点事件☆19Mar 8, 2020Updated 6 years ago