xhlgogo / Chinese-NLP-Newcomer
本项目爬取各省市政府工作报告,试图通过聚类、主题分类等将它们识别区分开来。
☆11Updated 5 years ago
Alternatives and similar repositories for Chinese-NLP-Newcomer:
Users that are interested in Chinese-NLP-Newcomer are comparing it to the libraries listed below
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 6 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战 。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆31Updated 4 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆53Updated 6 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆179Updated 6 years ago
- 金融知识图谱构建☆136Updated 6 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆195Updated 5 years ago
- self complemented BaiduIndexSpyder based on Selenium , index image decode and num image transfer,基于关键词的历时百度搜索指数自动采集☆41Updated 6 years ago
- 毕业设计,基于事理图谱的事件推理系统☆67Updated 4 years ago
- 个人实现的基于django,d3js与echarts的领域知识图谱检索与计量平台.面向语言政策领,包括语言政策领域的知识检索,关系检索与钻取,计量分析,知识可视化.☆25Updated 6 years ago
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 6 years ago
- 【自然语言处理】微博开放域事件抽取系统,又名“微博日历系统”。可以自动抓取新浪微博,提取命名实体和事件元素,对事件排序☆10Updated 2 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业 情感词典☆90Updated 3 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆99Updated 4 years ago
- Here we will sort out a variety of interesting Python library learning☆61Updated last year
- 医疗保险领域知识图谱☆128Updated 6 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆159Updated 6 years ago
- An exploration for Eventline (important news Rank organized by pulic time),针对某一事件话题下的新闻报道集合,通过使用docrank算法,对新闻报道进行重要性识别,并通过新闻报道时间挑选出时间线上重要…☆215Updated 6 years ago
- 一个BERT+BiLSTM的情感分析 BaseLine☆25Updated 4 years ago
- SMP 2020年微博情感分类评测任务 第六名解决方案☆68Updated 2 years ago
- 在非结构化文本中提取三元 组☆22Updated 5 years ago
- 多标签文本分类☆53Updated 5 years ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆117Updated 6 years ago
- A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…☆239Updated 6 years ago
- Event monitor based on online news corpus including event storyline and analysis,基于给定事件关键词,采集事件资讯,对事件进行挖掘和分析。☆152Updated 6 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆133Updated 5 years ago
- Syntax and Ruler-Based Doc sentiment analysis 基于依存句法规则的篇章级情感分析demo☆104Updated 5 years ago
- lda 主题模型 用于主题提取和文本分类☆25Updated 7 years ago
- 《自然语言理解与行业知识图谱-概念、方法与工程落地》 一书中介绍的各个章节的算法展示代码☆13Updated 7 months ago
- 基于字符级卷积神经网络的细粒度的中文情感分析以及具体的应用,将顾客打分和评论情感进行两极映射,使用数据自动标注和基于弱监督预训练的数据增强方式自动扩充和优化数据集,实验证实了在情感分类中,使用本文的字符级卷积神经网络(C-CNN-SA)可以在不依赖分词的情况下,达到的精度和…☆42Updated 5 years ago