Arsener / simple_search_engineLinks
社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度
☆19Updated 7 years ago
Alternatives and similar repositories for simple_search_engine
Users that are interested in simple_search_engine are comparing it to the libraries listed below
Sorting:
- Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…☆144Updated 7 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- CCF大数据比赛,基于主题的文本情感分析☆95Updated 7 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆84Updated 6 years ago
- 新闻检索:爬虫定向采集3-4个网页,实现网页信息的抽取、检索和索引。网页个数不少于10个,能按时间、相关度、热度等属性进行排序,并实现相似主题的自动聚类。可以实现:有相关搜索推荐、snippet生成、结果预览(鼠标移到相关结果, 能预览)功能☆128Updated 9 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆136Updated 5 years ago
- A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…☆243Updated 6 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆94Updated 6 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 7 years ago
- 组会ppt与论文--每一次的精心准备都值得留下记录😛☆150Updated 6 years ago
- CSDN用户画像技术评测☆27Updated 6 years ago
- NLP 以及相关的学习实践☆40Updated 3 years ago
- CSDN博客的关键词提取算法,融合TF,IDF,词性,位置等多特征。该项目用于参加2017 SMP用户画像测评,排名第四,在验证集中精度为59.9%,在最终集中精度为58.7%。启发式的方法,通用性强。☆30Updated 7 years ago
- 这是本人第一次数据算法比赛实录。主要整理记录2017年CCF大数据与计算智能竞赛使用的模型和实现代码,选择了基于主题的文本情感分析赛题。采用情感词典+自定义规则完成比赛,成绩:136/796。☆49Updated 7 years ago
- 细粒度用户评论情感分析☆123Updated 6 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆70Updated 10 years ago
- 细粒度情感分析repository1:Wai Mai Opinion Miner,细粒度情感分析系统GUI demo。☆112Updated 9 years ago
- 使用word2vec进行中文词向量的 训练☆91Updated 7 years ago
- gensim-word2vec+svm文本情感分析☆105Updated 7 years ago
- Kaggle challenge Bag of words meets bags of popcorn in Python 3☆36Updated 7 years ago
- 互联网新闻情感分析赛题baseline☆42Updated 5 years ago
- Syntax and Ruler-Based Doc sentiment analysis 基于依存句法规则的篇章级情感分析demo☆107Updated 6 years ago
- 计算新闻文本类情感分析(采用TF-IDF,余弦距离,情感依存等算法)☆58Updated 8 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆54Updated 7 years ago
- 2017 DF,CCF大数据与计算智能大赛——“中印对峙事件舆情分析”赛题全网数据☆25Updated 7 years ago
- SA☆33Updated 6 years ago
- AI-Challenger Baseline 细粒度用户评论情感分析☆230Updated 6 years ago
- 爬虫-百度百科-知识图谱探索☆199Updated 6 years ago
- 基于卷积神经网络参数优化的情感分析论文code☆61Updated 7 years ago
- Self complemented text feature extraction using algorithms including CHI, DF, IG, MI for the experiment of text classification based on s…☆49Updated 7 years ago