Arsener / simple_search_engineLinks
社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度
☆19Updated 7 years ago
Alternatives and similar repositories for simple_search_engine
Users that are interested in simple_search_engine are comparing it to the libraries listed below
Sorting:
- CCF大数据比赛,基于主题的文本情感分析☆94Updated 7 years ago
- 细粒度情感分析repository1:Wai Mai Opinion Miner,细粒度情感分析系统GUI demo。☆113Updated 9 years ago
- Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…☆143Updated 7 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆83Updated 6 years ago
- SA☆33Updated 6 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能 够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆57Updated 8 years ago
- A simple documentary topic analysis implement based on traditional K-means and LDA which can achieve a not-bad result. 基于Kmeans与Lda模型的多文…☆246Updated 6 years ago
- 这是本人第一次数据算法比赛实录。主要整理记录2017年CCF大数据与计算智能竞赛使用的模型和实现代码,选择了基于主题的文本情感分析赛题。采用情感词典+自定义规则完成比赛,成绩:136/796。☆48Updated 7 years ago
- AI Challenger 2018 细粒度用户评论情感分析比赛 个人baseline项目☆15Updated 7 years ago
- “达观杯”文本智能信息抽取挑战赛☆17Updated 6 years ago
- NLP 以及相关的学习实践☆40Updated 3 years ago
- CSDN用户画像技术评测☆27Updated 6 years ago
- 组会ppt与论文--每一次的精心准备都值得留下记录😛☆152Updated 6 years ago
- using jieba and doc2vec to implement sentiment analysis for Chinese docs☆79Updated 7 years ago
- 细粒度用户评论情感分析☆123Updated 7 years ago
- 基于条件随机场的医疗电子病例的命名实体识别☆114Updated 7 years ago
- 评论上的情感分析:主题与情感词抽 取☆81Updated 5 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆108Updated 7 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆70Updated 10 years ago
- AI-Challenger Baseline 细粒度用户评论情感分析☆230Updated 7 years ago
- 使用深度学习方法对IMDB电影评价做情感分析,使用的方法分别为:MLP、BiRNN、BiGRU+Attention Model☆225Updated 8 years ago
- gensim-word2vec+svm文本情感分析☆104Updated 8 years ago
- Syntax and Ruler-Based Doc sentiment analysis 基于依存句法规则的篇章级情感分析demo☆107Updated 6 years ago
- 个人代码/项目仓库(具体请看子目录下的README.md)。自取请注明出处,尊重原创,O(∩_∩)O谢谢☆44Updated 7 years ago
- CSDN博客的关键词提取算法,融合TF,IDF,词性,位置等多特征。该项目用于参加2017 SMP用户画像测评,排名第四,在验证集中精度为59.9%,在最终集中精度为58.7%。启发式的方法,通用性强。☆30Updated 7 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 7 years ago
- 互联网新闻情感分析赛题baseline☆42Updated 6 years ago
- 使用word2vec进行中文词向量的 训练☆91Updated 7 years ago
- 爬虫-百度百科-知识图谱探索☆200Updated 6 years ago
- 2nd Place Solution for SMP CUP 2016☆93Updated 8 years ago