xhlgogo / Chinese-NLP-NewcomerLinks
本项目爬取各省市政府工作报告,试图通过聚类、主题分类等将它们识别区分开来。
☆13Updated 6 years ago
Alternatives and similar repositories for Chinese-NLP-Newcomer
Users that are interested in Chinese-NLP-Newcomer are comparing it to the libraries listed below
Sorting:
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条 含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆166Updated 6 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆104Updated 5 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆139Updated 6 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆202Updated 6 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆61Updated 4 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆35Updated 5 years ago
- 基于法律裁判文书的事件抽取及其应用,包括数据的分词、词性标注、命名实体识别、事件要素抽取和判决结果预测等内容☆601Updated 5 months ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated 2 months ago
- 基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为baseline。☆109Updated 6 years ago
- gensim-word2vec+svm文本情感分析☆104Updated 8 years ago
- 慕课网公开课:数据预处理☆75Updated 6 years ago
- 以nlp中情感分析为例,从没有打过标签的语料开始一步步教你怎么去打标签,然后分别以传统的机器学习模型SVM和深度学习模型LSTM去建模。☆36Updated 6 years ago
- 基于情感字典的情感分析模型☆40Updated 8 years ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆79Updated 6 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆184Updated 7 years ago
- 基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致,实时对在线民宿的满意度评测,包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询 POI …☆436Updated last year
- 金融知识图谱构建☆143Updated 7 years ago
- 中文情感分析模型,包含各种主流的情感词典、机器学习、深度学习、预训练模型方法☆110Updated 6 years ago
- 医疗保险领域知识图谱☆135Updated 7 years ago
- 博客文章开源代码分享区☆126Updated 4 years ago
- 中文商品评论短文本分类器,可用于情感分析☆367Updated 3 years ago
- 计算新闻文本类情感分析(采用TF-IDF,余弦距离,情感依存等算法)☆58Updated 8 years ago
- 今日头条中文新闻(文本)分类数据集☆70Updated 7 years ago
- 中文情感分析-textcnn☆24Updated 2 years ago
- A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…☆246Updated 6 years ago
- 中文文本聚类☆122Updated 3 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 6 years ago
- 农业领域知识图谱的构建,包括数据爬取(百度百科)、数据分类、利用结构化数据生成三元组、非结构化数据的分句(LTP),分词(jieba),命名实体识别(LTP)、基于依存句法分析(主谓关系等)的关系抽取和利用neo4j生成可视化知识图谱☆254Updated 5 years ago
- 文本聚类、tfidf、lda、doc2vec+kmeans等各种方法实现☆23Updated 5 years ago