speciallurain / CNKI_Patent_SVMLinks

文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律，爬取70多万条2014年公开的发明专利，然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取，依照词频排序提取前3000个词语形成语义词典，然后根据观察设置停用词。然后再用TF-IDF的方式对每个摘要进行词频选取，通过布尔模型，对比语义词典生成文本向量。然后对标签进行数字化转换。取90%的文本为训练集，10%的文本为测试集。用有监督学习的SVM算法对文本进行分类，（人类生活必需品、作业运输、化学冶金、纺织造纸、固定建筑物、机械工程、物理学、电学）分成8类

☆108

Alternatives and similar repositories for CNKI_Patent_SVM

Users that are interested in CNKI_Patent_SVM are comparing it to the libraries listed below

Sorting:

Jacen789 / HotNewsAnalysis
利用文本挖掘技术进行新闻热点关注问题分析
☆163Updated 6 years ago
ashora / SocialListening
依据香港中文大学设计的规则系统，先用小样本评论建立初始关键词库，再结合18种句式逐条匹配评论，能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后，达到较高准确率的基础上，使用Tableau进一步分析数据，识别出客户集中关注的商品属性、普遍好评差评的商品属性；通过…
☆54Updated 7 years ago
Zbored / Chinese-sentiment-analysis
gensim-word2vec+svm文本情感分析
☆105Updated 7 years ago
jcsyl / news-analyst
对舆情事件进行词云展示，对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类，观点抽取基于AP 算法的聚类和MMR的抽取
☆183Updated 6 years ago
xiaoyichao / -python-gensim-LDA-
基于python gensim 库的LDA算法对中文进行文本分析，很难得，网上都是英文的，基本上没有中文的，需要安装jieba分词进行分词，然后去除停用词最后才能使用LDA
☆136Updated 5 years ago
fajiel / news_sentiment
计算新闻文本类情感分析（采用TF-IDF，余弦距离，情感依存等算法）
☆58Updated 7 years ago
liuhuanyong / DocSentimentAnalysis
Syntax and Ruler-Based Doc sentiment analysis 基于依存句法规则的篇章级情感分析demo
☆107Updated 6 years ago
moxiu2012 / PJ_NLP
该库是一个项目集，包括文本分类、多标签分类、细粒度情感分析、命名实体识别，以及部分数据集等
☆201Updated 6 years ago
liuhuanyong / SentenceSentimentClassifier
Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…
☆144Updated 7 years ago
shibing624 / text-feature
文本特征提取，适用于小说，论文，议论文等文本，提取词语、句子、依存关系等特征。python开发。
☆42Updated 7 years ago
liuhuanyong / EventMonitor
Event monitor based on online news corpus including event storyline and analysis，基于给定事件关键词，采集事件资讯，对事件进行挖掘和分析。
☆152Updated 6 years ago
liuhuanyong / TopicCluster
A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…
☆243Updated 6 years ago
l-passer / sentiment-analysis
基于情感字典的情感分析模型
☆41Updated 8 years ago
7125messi / sentiment_analysis_from_raw_corpus
以nlp中情感分析为例，从没有打过标签的语料开始一步步教你怎么去打标签，然后分别以传统的机器学习模型SVM和深度学习模型LSTM去建模。
☆36Updated 6 years ago
jarvisqi / machine_learning
NLP 以及相关的学习实践
☆40Updated 3 years ago
chapzq77 / LTP_Python_Interface
根据自己搭的 LTP 服务器，实现：分词、词性标注、命名实体识别、依存句法分析、语义角色标、命名实体的抽取：人名，地名，机构名、三元组的抽取：主谓宾，动宾关系，介宾关系，（实体1，关系，实体2）
☆144Updated 8 years ago
GeneralZh / Chinese_Corpus
中文语料库：包括情感词典情感分析文本分类单轮对话中文词典知乎
☆117Updated 7 years ago
liuhuanyong / ImportantEventExtractor
An exploration for Eventline (important news Rank organized by pulic time)，针对某一事件话题下的新闻报道集合，通过使用docrank算法，对新闻报道进行重要性识别，并通过新闻报道时间挑选出时间线上重要…
☆223Updated 6 years ago
netrookiecn / LinLP
使用Python进行自然语言处理相关实践，如新词发现，主题模型，隐马尔模型词性标注，Word2Vec，情感分析
☆52Updated 5 years ago
GHY73 / BiaoZhuTool
文本标注工具，给文本打标签
☆20Updated 5 years ago
GGL12 / TextMining
某电商手机评论的文本挖掘初体验功能板块：数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序
☆122Updated 6 years ago
Guanngxu / economic_audit_knowledge_graph
经济责任审计知识图谱：网络爬虫、关系抽取、领域词汇判定
☆125Updated 5 years ago
CarryChang / Customer_Satisfaction_Analysis
基于在线民宿 UGC 数据的意见挖掘项目，包含数据挖掘和NLP 相关的处理，负责数据采集、主题抽取、情感分析等任务。目的是克服用户打分和评论不一致，实时对在线民宿的满意度评测，包含在线评论采集和情感可视化分析。搭建了百度地图POI查询入口，可以进行自动化的批量查询 POI …
☆431Updated 9 months ago
CarryChang / C-CNN-for-Chinese-Sentiment-Analysis
基于字符级卷积神经网络的细粒度的中文情感分析以及具体的应用，将顾客打分和评论情感进行两极映射，使用数据自动标注和基于弱监督预训练的数据增强方式自动扩充和优化数据集，实验证实了在情感分类中，使用本文的字符级卷积神经网络(C-CNN-SA)可以在不依赖分词的情况下，达到的精度和…
☆47Updated 5 years ago
renjunxiang / chatbot_by_similarity
根据文本相似度实现问答的聊天机器人（简单版）
☆52Updated 7 years ago
chaoming0625 / WaiMaiOpinionMiner
细粒度情感分析repository1：Wai Mai Opinion Miner，细粒度情感分析系统GUI demo。
☆112Updated 9 years ago
yirui-wang-0212 / NLP-SentimentAnalysisForChineseText
Python中文文本挖掘：使用机器学习方法进行情感分析。
☆103Updated 6 years ago
danan0755 / Bert_Classifier
bert文本分类，ner, albert，keras_bert，bert4keras，kashgari，fastbert，flask + uwsgi + keras部署模型，时间实体识别，tfidf关键词抽取，tfidf文本相似度，用户情感分析
☆196Updated last year
PengboLiu / Doc2Vec-Document-Similarity
利用Doc2Vec计算文本相似度
☆138Updated 7 years ago
ScarlettYellow / Chindia
2017 DF,CCF大数据与计算智能大赛——“中印对峙事件舆情分析”赛题全网数据
☆25Updated 7 years ago