xhlgogo / Chinese-NLP-Newcomer
本项目爬取各省市政府工作报告,试图通过聚类、主题分类等将它们识别区分开来。
☆13Updated 6 years ago
Alternatives and similar repositories for Chinese-NLP-Newcomer:
Users that are interested in Chinese-NLP-Newcomer are comparing it to the libraries listed below
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 7 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 6 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆61Updated 4 years ago
- 基于 RoBERTa-wwm-ext 模型的微博中文情绪识别☆33Updated 3 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆200Updated 6 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆93Updated 3 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 5 years ago
- 文本聚类、tfidf、lda、doc2vec+kmeans等各种方法实现☆23Updated 5 years ago
- 从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Informatio…☆90Updated 5 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 6 years ago
- 系统的介绍如何搭建一个完整的文本分类系统,包括数据预处理、主要方法的原理介绍和实现细节、实验结果与分析、网页Demo的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https://blog.csdn.net/sdu_hao/category_9286…☆29Updated 5 years ago
- smp ewect code☆77Updated 4 years ago
- 基于字符级卷积神经网络的细粒度的中文情感分析以及具体的应用,将顾客打分和评论情感进行两极映射,使用数据自动标注和基于弱监督预训练的数据增强方式自动扩充和优化数据集,实验证实了在情感分类中,使用本文的字 符级卷积神经网络(C-CNN-SA)可以在不依赖分词的情况下,达到的精度和…☆45Updated 5 years ago
- gensim-word2vec+svm文本情感分析☆103Updated 7 years ago
- multi-label-classification-4-event-type☆133Updated 2 years ago
- 慕课网公开课:数据预处理☆73Updated 5 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆193Updated 8 months ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆77Updated 5 years ago
- 金融知识图谱构建☆138Updated 6 years ago
- 使用Python进行自然语言处理相关实践,如新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析☆51Updated 5 years ago
- ☆82Updated 6 years ago
- Bert预训练模型fine-tune计算文本相似度☆104Updated last year
- 爬取百度百科词条,抽取三元组,构建知识图谱☆35Updated 5 years ago
- lda 主题模型 用于主题提取和文本分类☆26Updated 7 years ago
- Sequential Event Experiment based on Travel note crawled from XieCheng,基于50W携程出行游记的采集与顺承事件图谱构建.☆182Updated 6 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago
- SMP 2020年微博情感分类评测任务 第六名解决方案☆68Updated 2 years ago
- 中文情感分析-textcnn☆24Updated 2 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆29Updated 5 years ago