Cheereus / PdfSplitterLinks
将pdf转为txt然后进行分词,并进行词频统计
☆34Updated last year
Alternatives and similar repositories for PdfSplitter
Users that are interested in PdfSplitter are comparing it to the libraries listed below
Sorting:
- Simple examples of text data visualization. 文本人物可视化,词云、人物关系图谱☆112Updated 8 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆170Updated 7 years ago
- 游客 旅行评论爬虫 + 词频分析 + 情感分析(使用达观数据API)☆24Updated 7 years ago
- 对小说文本进行分析,提炼小说剧情内容和人物关系☆87Updated 6 years ago
- 该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit☆18Updated 3 years ago
- 微信好友男女比例,区域排名,签名情感分析☆44Updated 6 years ago
- 📃您身边的AI法律顾问(比赛项目)☆23Updated last year
- 基于深度学习的对话系统、语音识别、机器翻译和语音合成等。☆13Updated 5 years ago
- 春江水暖“鸭先知”,“鸭先知”是一个利用新闻文本做舆情分析的系统☆47Updated 5 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆183Updated 7 years ago
- 应用商店评论爬虫、分词、情感分析等☆19Updated 6 years ago
- 中国知网爬虫☆158Updated 8 years ago
- 基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI …☆438Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 11 months ago
- 金庸小说人物关系图谱构建☆63Updated 6 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- 中文谣言数据☆774Updated 5 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆57Updated 8 years ago
- 基于微博的数据挖掘与社交舆情分析☆220Updated 7 years ago
- 新闻分类系统&谣言处理系统☆78Updated 8 years ago
- 使用python抓取京东全站数据(商品,店铺,分类,评论)☆67Updated 3 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆81Updated 5 years ago
- 法律文书网爬虫☆20Updated 7 years ago
- 中文文本分析工具包(包括- 文本分类 - 文本聚类 - 文本相似性 - 关键词抽取 - 关键短语抽取 - 情感分析 - 文本纠错 - 文本摘要 - 主题关键词-同义词、近义词-事件三元组抽取)☆733Updated 2 years ago
- sentiment analysis、情感分析、文本分类、基于字典、python、classification☆132Updated 5 years ago
- 对收集的法律文档进行一系列分析,包括根据规范自动切分、案件相似度计算、案件聚类、法律条文推荐等(试验目前基于婚姻类案件,可扩展至其它领域)。☆204Updated 8 years ago
- 爬取专利信息的爬虫☆26Updated 9 years ago
- The crawler for data on web of science, especially focus on the analysis of citation data☆16Updated 7 years ago
- 中文微博语料库 情感二分类☆279Updated 5 years ago
- 中文文本摘要/关键词提取☆436Updated 5 years ago