Arsener / simple_search_engineLinks
社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度
☆19Updated 7 years ago
Alternatives and similar repositories for simple_search_engine
Users that are interested in simple_search_engine are comparing it to the libraries listed below
Sorting:
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆94Updated 6 years ago
- 细粒度情感分析repository1:Wai Mai Opinion Miner,细粒度情感分析系统GUI demo。☆113Updated 9 years ago
- 组会ppt与论文--每一次的精心准备都值得留下记录😛☆152Updated 6 years ago
- CCF大数据比赛,基于主题的文本情感分析☆94Updated 7 years ago
- NLP 以及相关的学习实践☆40Updated 3 years ago
- Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…☆144Updated 7 years ago
- CSDN用户画像技术评测☆27Updated 6 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…☆244Updated 6 years ago
- CSDN博客的关键词提取算法,融合TF,IDF,词性,位置等多特征。该项目用于参加2017 SMP用户画像测评,排名第四,在验证集中精度为59.9%,在最终集中精度为58.7%。启发式的方法,通用性强。☆30Updated 7 years ago
- 计算新闻文本类情感分析(采用TF-IDF,余弦距离,情感依存等算法)☆58Updated 8 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆70Updated 10 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 7 years ago
- 这是本人第一次数据算法比赛实录。主要整理记录2017年CCF大数据与计算智能竞赛使用的模型和实现代码,选择了基于主题的文本情感分析赛题。采用情感词典+自定义规则完成比赛,成绩:136/796。☆48Updated 7 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆84Updated 6 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆56Updated 8 years ago
- 基于卷积神经网络参数优化的情感分析论文code☆61Updated 7 years ago
- 细粒度用户评论情感分析☆123Updated 7 years ago
- using jieba and doc2vec to implement sentiment analysis for Chinese docs☆79Updated 6 years ago
- 2nd Place Solution for SMP CUP 2016☆93Updated 8 years ago
- 提出基于划分的LDA主题模型 (PLDA)。对传统LDA模型进行改进,考虑中长篇文档篇章结构较为清晰,传统LDA在处理中长篇文档时不能识别每个篇章的主题,提出基于划分的LDA主题模型,对中长篇文档如新闻报道】国务院工作报告等按照段落进行划分,先拆后合,并将其效果与传统LDA…☆41Updated 6 years ago
- 互联网新闻情感分析赛题baseline☆42Updated 6 years ago
- SA☆33Updated 6 years ago
- 农业知识图谱(KG):农业领域的信息检索,命名实体识别,关系抽取,分类树构建,数据挖掘☆14Updated 7 years ago
- Self complemented text feature extraction using algorithms including CHI, DF, IG, MI for the experiment of text classification based on s…☆49Updated 7 years ago
- 基于条件随机场的医疗电子病例的命名实体识别☆114Updated 7 years ago
- 知识图谱问答系统☆87Updated 2 years ago
- 深度学习用于近日头条用户画像☆27Updated 7 years ago
- 爬虫-百度百科-知识图谱探索☆199Updated 6 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆137Updated 6 years ago