xhlgogo / Chinese-NLP-Newcomer
本项目爬取各省市政府工作报告,试图通过聚类、主题分类等将它们识别区分开来。
☆11Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for Chinese-NLP-Newcomer
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆104Updated 6 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆55Updated 3 years ago
- 基于LSTM网络与自注意力机制对中文评论进行细粒度情感分析☆54Updated 3 years ago
- gensim-word2vec+svm文本情感分析☆101Updated 7 years ago
- 基于bert的情感分析(pytorch)☆28Updated 5 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆178Updated 6 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技 术的发展,建立基于自然语言处理技术的…☆30Updated 4 years ago
- 毕业设计,基于事理图谱的事件推理系统☆66Updated 4 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆195Updated 5 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆39Updated 4 years ago
- 从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Informatio…☆88Updated 4 years ago
- 一个BERT+BiLSTM的情感分析 BaseLine☆26Updated 4 years ago
- 基于深度学习的中文评论情感分类和智能客服研究与实现。主要是酒店和书店的评论情感分析(二分类+九分类),可以判定积极和消极,对于消极评论,还可以判断其具体类别,比如物流不好或者服务差等等。☆42Updated 4 years ago
- 医疗保险领域知识图谱☆127Updated 6 years ago
- Self complemented Key infomation extraction including keywords, abstract from text using algorithm like textrank ,tfidf 基于Textrank算法的文本摘要…☆54Updated 6 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆30Updated 4 years ago
- 以nlp中情感分析为例,从没有打过标签的语料开始一步步教你怎么去打标签,然后分别以传统的机器学习模型SVM和深度学习模型LSTM去建模。☆33Updated 5 years ago
- 对汽车之家论坛里的评论数据处理和分析,利用用户潜在行为数据得出用户行为特征,采用LDA主题模型得出用户评论的主题特征,采用Word2Vec词向量模型得出用户评论的文本内容特征,采用K-Means聚类得出水军文本类别,结合用户行为特征,最终实现了对网络水军的识别。☆22Updated 4 years ago
- 多标签文本分类☆53Updated 5 years ago
- 文本聚类、tfidf、lda、doc2vec+kmeans等各种方法实现☆23Updated 4 years ago
- 基于字符级卷积神经网络的细粒度的中文情感分析以及具体的应用,将顾客打分和评论情感进行两极映射,使用数据自动标注和基于弱监督预训练的数据增强方式自动扩充和优化数据集,实验证实了在情感分类中,使用本文的字符级卷积神经网络(C-CNN-SA)可以在不依赖分词的情况下,达到的精度和…☆41Updated 4 years ago
- 文本二分类任务,是否文档是否属于政治上的出访类事件,利用BERT提取特征,模型采用简单的DNN。☆63Updated 4 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆156Updated 5 years ago
- Ai_challenge2018_nlp细粒度情感分析——代码复现☆21Updated 5 years ago
- 医疗图谱,Python前期数据抓取与处理,后期配合neo4j实现图谱构造与实体搜索。☆52Updated 5 years ago
- 细粒度用户评论情感分析☆117Updated 6 years ago
- 今日头条中文新闻(文本)分类数据集☆61Updated 6 years ago
- 情感分析三分类☆28Updated 3 months ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆89Updated 3 years ago