MrLiuBee / IREngine
国科大信息检索大作业项目-新闻及评论搜索:定向采集不少于4个中文社会新闻网站或频道,实现这些网站新闻信息及评论信息的自动爬取、抽取、索引和检索。
☆19Updated 8 months ago
Alternatives and similar repositories for IREngine:
Users that are interested in IREngine are comparing it to the libraries listed below
- flask+vue 期末大作业,一个有nlp分析文本功能的爬虫小说网站☆11Updated 2 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆43Updated 4 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 7 years ago
- 小象学院社交网络分析课程的整理代码☆23Updated 6 years ago
- 本次课程体系由复旦大学肖仰华教授策划,讲者为复旦大学、华为云、湖南大学、华东师范大学、上海财经大学、东华大学、苏州大学等青年学者。课程在国内多次巡回演讲,受到参会人员一致好评。 知识图谱课程全面系统讲授、研讨知识图谱相关概念与技术主题,对当前行业落地过程的一系列困难进行答…☆11Updated 4 years ago
- 【信息检索课程设计】sdu新闻网站全站爬取+索引构建+搜索引擎☆58Updated 10 months ago
- 仓库主要记录 NLP 算法工程师相关的顶会论文研读笔记【文 本匹配篇】☆12Updated 2 years ago
- 豆瓣Top250影评爬虫(用于情感分析语料)☆21Updated 2 years ago
- 对汽车之家论坛里的评论数据处理和分析,利用用户潜在行为数据得出用户行为特征,采用LDA主题模型得出用户评论的主题特征,采用Word2Vec词向量模型得出用户评论的文本内容特征,采用K-Means聚类得出水军文本类别,结合用户行为特征,最终实现了对网络水军的识别。☆24Updated 5 years ago
- UCAS研一课程大数据分析的笔记和代码☆35Updated 9 months ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆61Updated 5 years ago
- 使用Simhash对海量文本进行去重☆12Updated 6 years ago
- 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第三场 —— 零基础入门NLP之新闻文本分类挑战赛。赛题以自然语言处理为背景,要求选手 根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触N…☆15Updated 4 years ago
- 热门推荐、基于内容推荐、基于用户协同过滤推荐、基于物品协同过滤推荐☆38Updated 6 years ago
- datafountain 疫情期间网民情绪识别 43 名 模型分享☆7Updated 4 years ago
- CSDN用户画像技术评测☆27Updated 5 years ago
- 社会信息检索作业,实现简单的搜索引擎,计算TFIDF值以及两个句子的相似度☆19Updated 6 years ago
- 文本聚类 k-means算法及实战☆54Updated 6 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆48Updated 3 weeks ago
- 记录☆16Updated last month
- smp2018用户画像技术评测☆21Updated 6 years ago
- 中文问答系统:使用NLP相关技术,对搜索引擎,问答社区等进行信息抽取,文本概括等,支持通识问答,社区问答和部分专业问答☆32Updated 2 years ago
- 练习题︱基于今日头条开源数据的文本挖掘☆84Updated 6 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 6 years ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆45Updated 2 years ago
- 疫情期间网民情绪识别比赛baseline,使用BERT进行端到端的fine-tuning,datafountain平台,平台评测F1值0.716。☆35Updated 5 years ago
- 推荐系统,web端展示基于django☆12Updated 7 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。使用Bert-As-Service库中的中文Bert模型进行句向量的提取,加入全连接层后进行三分类。☆29Updated 5 years ago
- 智源研究院&中科院计算所-互联网虚假新闻检测挑战赛☆69Updated 5 years ago
- 我们对一个知乎社交网络进行了基础属性、度分布、节点影响力、社区检测等分析操作,得到了一些有趣的结论(补充),发现了知乎社交网络的哪些特性(具体写出来)。之后,我们又做了一个知乎兴趣内容推荐系统,对用户的兴趣偏好进行分析,为用户推荐话题、问题、答主等相关内容,取得了不错的效果…☆27Updated 5 years ago