Justin3go / xiu-search
XiuSearch是一款搜索技术博客的搜索引擎,当然,如果你将种子网址换成新闻网站,这就是一个新闻搜索引擎,它对于文章搜索来说是通用的。
☆57Updated 3 years ago
Alternatives and similar repositories for xiu-search:
Users that are interested in xiu-search are comparing it to the libraries listed below
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆61Updated 5 years ago
- python搭建搜索引擎☆30Updated 2 years ago
- 【信息检索课程设计】sdu新闻网站全站爬取+索引构建+搜索引擎☆58Updated 10 months ago
- 基于elasticsearch的电影搜索引擎☆55Updated 2 years ago
- 观察者新闻网爬虫(新闻爬虫),基于python+Flask+Echarts,实现首页与更多新闻页面爬取(Requests+etree+Xpath)+新闻存储(MySQL)+文本分析(Jieba)+可视化(新闻词云,词频统计)。☆95Updated 3 years ago
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆45Updated 2 years ago
- ElasticSearch+Django+Scrapy搜索引擎☆27Updated 2 years ago
- 2020中国大学生计算机设计大赛 参赛作品采集☆59Updated 2 years ago
- 智能简历解析系统,支持多维度信息提取☆88Updated 3 weeks ago
- 对淘宝(天猫)的评论爬取并进行简单分析☆27Updated 4 years ago
- An Open Source Study App that developed with Flask and MiniProgram.记忆手卡小程序开源 【FLask + 微信小程序】(记忆卡片)(学习类App)|(入门项目)(flask项目)(有接口文档)☆110Updated 4 years ago
- 数据获取(Python爬虫)>>数据持久化(MySQL)>>Flask搭建Web后台>>数据可视化(H5+Echarts)☆37Updated 3 years ago
- 使用scrapy从全国六大较权威的新闻网站(澎湃新闻、新华网、新京报、凤 凰网、光明网、人民网)爬取最近15天内的新闻,利用爬取数据提取省份信息、计算新闻热点值、使用预训练模型生成新闻类别后存入Mysql数据库,网页使用HTML、CSS、JavaScript进行编写,采用开…☆25Updated 2 years ago
- CS-Learn里面的工程基本都保存在了这里~☆24Updated 2 years ago
- 基于scrapy的中国国内各大新闻网站内容爬虫☆26Updated 3 years ago
- 一个基于elasticsearch开发的搜索引擎网站☆14Updated 2 years ago
- 一个利用机器学习做数据挖掘实战的小项目,参考书《Python数据分析与挖掘实战》☆27Updated 6 years ago
- 模拟Linux文件系统☆32Updated 4 years ago
- 新闻搜索引擎,定时自动爬取各大新闻门户网站,并提供检索功能,对检索话题(关键词)进行热度、新鲜程度的反馈,并返回所有能找到的新闻。(如新浪新闻、网易新闻等,或某垂直领域权威性的网站如经济领域的雪球财经、东方财富等,或者体育领域的腾讯体育、虎扑体育等)☆32Updated 2 years ago
- 基于机器学习与BERT的在线招聘欺诈检测平台☆14Updated 4 years ago
- 使用Python编写的基于socket UDP通信的多功能即时聊天室,包含Tkinter编写的图形化聊天界面,功能包括有账号注册和登录,登录成功后可以查看在线用户,并和聊天室内的其他在线用户聊天,包含私聊和群发,能发送文字、表情包,以及文件等☆47Updated 2 years ago
- Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐☆110Updated 3 years ago
- 豆瓣Top500电影爬虫&分析可视化☆26Updated 4 years ago
- 基于RNN的中国古诗词生成模型(SJTU CS382 Course Project)☆10Updated 6 years ago
- Computer Organization Principles Experiment The Computer Organization Principles Experiment of East China University of Science and Tech…☆23Updated last week
- 应用Python爬虫、Flask框架、Echarts、WordCloud等技术将豆瓣租房信息爬取出来保存于Excel和数据库中,进行数据可视化操作、制作网页展示。☆40Updated 4 years ago
- scrapy爬取研招网专业信息☆72Updated 5 months ago
- 微博的爬虫,爬个人主页,用的scrapy 框架☆27Updated 3 weeks ago
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数 、点赞次数、原博地址。☆29Updated last year
- 基于MFC的卡通连连看游戏,数据结构与算法综合实验☆15Updated 4 years ago