jangocheng / bdp-baseLinks
大数据生态解决方案基础平台: 搜索系统、公共系统、任务管理系统、数据binlog采集、基础爬虫系统、数据传输系统、运维告警系统、APM、报表系统
☆10Updated 4 years ago
Alternatives and similar repositories for bdp-base
Users that are interested in bdp-base are comparing it to the libraries listed below
Sorting:
- 007 基于网络爬虫技术的新闻分析系统-毕业设计展示 python django vue scrapy jieba nlp 爬虫抓取 新闻列表 新闻详情 新闻分类 新闻摘要抽取 关键词分析 情感分析 朴素贝叶斯算法 词性分析 后台管理新闻数据☆13Updated 2 years ago
- 使用scrapy从全国六大较权威的新闻网站(澎湃新闻、新华网、新京报、凤 凰网、光明网、人民网)爬取最近15天内的新闻,利用爬取数据提取省份信息、计算新闻热点值、使用预训练模型生成新闻类别后存入Mysql数据库,网页使用HTML、CSS、JavaScript进行编写,采用开…☆28Updated 2 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 6 years ago
- 基于python的二手商品交易平台 python+django开发的供需平台 - 毕业设计 - 课程设计☆35Updated last year
- 项目名称:基于Python的疫情实时监控系统。项目基于Python语言、Python的Flask框架和Echarts来做的,涉及的技术有Python网络爬虫;Python与MySQL数据库的交互;Flask框架构建Web项目;Echarts数据可视化显示;Linux部署we…☆31Updated 5 years ago
- [2023.05.09]基于selenium的新浪微博关键字搜索结果全自动爬虫,支持自定义搜素关键字、搜索起始时间、爬取起始页数(以实现中断后接上次继续爬取)。爬取内容包括微博账号、发文时间、发送平台、微博内容、转发次数、评论次数、点赞次数、原博地址。☆31Updated last year
- 给定文本和图片,自动生成一个相应的含字幕的短视频。完全自动化,可批量生成☆26Updated last year
- 毕设项目--面向短视频的流量数据爬取和分析系统☆33Updated 5 years ago
- 高考成绩分析系统☆15Updated 7 years ago
- 使用Django2.2+MySQL+spark实现在线电影推荐系统。其中MySQL部分支持在线计算,spark支持离线计算。☆33Updated 6 years ago
- 网络舆情分析系统☆188Updated 9 years ago
- vue+Python+flask 资产管理系统☆35Updated 2 years ago
- 爬取智联招聘网数据,并对其进行招聘数据可视化,爬虫,Data visualization,Django2,echarts☆134Updated last year
- 请切换分支到Django-vue!!!毕业设计-中国知网(cnki)爬虫及数据可视化,采用Django和Celery将爬虫内置在网站内,展示实时爬取的数据☆78Updated 4 years ago
- 这是一个Python FastAPI项目工程库,包含DB、Redis、MongoDB、JSON等工具和基础服务类。☆22Updated 4 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆55Updated 3 years ago
- boss直聘爬虫,boss,招聘,数据可视化,pyecharts,selenium ,xpath☆25Updated 4 years ago
- 基于flask构建微电影网站,已部署测试(附线上部署过程),增加异步功能,项目结构优化,发送弹幕,速率控制☆67Updated 7 years ago
- 今日热榜项目TopList的Python实现,异步爬取微博热榜,知乎,V2EX,GIthub,通过Flask展示。☆70Updated 5 years ago
- 分布式采集拉钩网中杭州爬虫相关职位的数据并使用Flask进行数据的可视化与分析☆37Updated 7 years ago
- Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐☆118Updated 4 years ago
- 基于豆瓣影视数据(不完整)的影视大数据分析平台。爬虫(影视数据和用户数据),推荐系统(基于用户的协同过滤算法),后台(flask实现的简易后台)。☆34Updated 7 years ago
- 基于Flask和Vue的前后端分离Web后台管理系统☆82Updated 7 years ago
- 在线考试系统后端☀️☆109Updated 5 months ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆39Updated 6 years ago
- awesome-python 是 vinta 发起维护的 Python 资源列表,内容包括:Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等。十分受Python开发者的青睐。☆49Updated 6 years ago
- 基于Django做的一个新闻网站,有新闻展示、搜索、在线视频播放、资源下载、订单支付、后台CMS管理等功能☆115Updated 2 years ago
- 基于Python3爬取知乎每日热点、每小时更新一次,并归档☆22Updated 3 months ago
- 毕业设计京东商品评论爬虫分析☆13Updated 6 years ago
- django+es搭建的前后端分离,唐诗宋词搜索引擎。☆36Updated 3 years ago