eshinesimida / ctripLinks
☆13Updated 5 years ago
Alternatives and similar repositories for ctrip
Users that are interested in ctrip are comparing it to the libraries listed below
Sorting:
- 慕课网公开课:数据预处理☆74Updated 6 years ago
- 以城市为单位爬取新浪微博移动端poi与poi下的微博信息☆26Updated 4 years ago
- 新浪微博的爬虫☆81Updated 11 months ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆78Updated 6 years ago
- 关于百度旅游、大众点评、驴妈妈、猫途鹰、携程的评论爬虫☆23Updated 6 years ago
- 该资源为调用大连理工情感词典实现的情感分析和情绪分类,并与SnowNLP进行对比。基础性文章,希望对您有所帮助~☆102Updated 4 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- 基于jieba分词和lda模型的主题分析☆19Updated 6 years ago
- 对微博评论进行情感三分类(正面,中性,负面)☆16Updated 5 years ago
- 基于关键词搜索结果的微博爬虫☆31Updated 6 years ago
- 新浪微博#新冠疫情话题 舆情分析与话题热度预测☆20Updated 4 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆122Updated 6 years ago
- 汽车之家口碑网某车型的评论数据情感分析☆31Updated 6 years ago
- 在Python中利用情感词典做情感分析☆43Updated 7 years ago
- 基于情感词典的文本情感极性分析☆27Updated 8 years ago
- 自制Python玩具小爬虫,用来爬取失信被执行人、专利等数据☆20Updated 4 years ago
- 京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、☆80Updated 6 years ago
- Scrapy 新浪微博搜索爬虫☆17Updated 5 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆79Updated 4 years ago
- 基于selenium的轻量级新浪微博爬虫,可实现:1.后台自动爬取微博搜索结果/2.按时间段爬取搜索结果/3.爬取用户基本信息☆51Updated 5 years ago
- lda 主题模型 用于主题提取和文本分类☆26Updated 7 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆141Updated last month
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆182Updated 6 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- 基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI …☆430Updated 7 months ago
- Python中文文本挖掘:使用机器学习方法进行情感分析。☆103Updated 6 years ago
- 微博情感分析☆30Updated 7 years ago
- 借助Python抓取微博数据,并对抓取的数据进行情绪分析☆370Updated 2 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆136Updated 5 years ago
- 数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)☆18Updated 4 years ago