CapAllen / Mini_Data_Middle_PlateformLinks
基于Python+Flask+MySQL的数据微中台,支持数据库管理、数据收集(某乎爬虫等)等功能
☆10Updated 4 years ago
Alternatives and similar repositories for Mini_Data_Middle_Plateform
Users that are interested in Mini_Data_Middle_Plateform are comparing it to the libraries listed below
Sorting:
- 基于python开发爬虫脚本,并使用django,echarts对数据进行分析☆26Updated 6 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆63Updated 5 years ago
- 利用flask进行echarts/pyecharts,Web程序开发,机器学习模型部署☆28Updated 2 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆79Updated 4 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆163Updated 6 years ago
- 爬取智联招聘网数据,并对其进行招聘数据可视化,爬虫,Data visualization,Django2,echarts☆135Updated last year
- 该资源将应用人工智能技术研究水族文化、文字和古籍。为更好的抢救和保护濒危水族文字和非物质文化遗产,作者申请并开源了该项目,主要通过人工智能技术识别水书,构建与汉字的自动翻译系统,实现水族本体和文献知识图谱构建,挖掘新词并溯源民族变迁历史。作者回到家乡贵州教书以来,对利用AI…☆45Updated last year
- 网络爬虫+Flask搭建web/Echarts可视化大屏/MySQL数据库实现大型可视化疫情数据☆22Updated 4 years ago
- 该项目是基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎湃网站上的新闻,将标题,内容,评论,时间等内容整理并保存到本地☆39Updated 5 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆104Updated 6 years ago
- Python Flask Web 框架入门教程☆69Updated 3 weeks ago
- 知网论文数据爬虫☆55Updated last year
- A python spider crawling second-hand house info from homelink and storing data to django models.☆20Updated 2 years ago
- Flask Tutorial☆87Updated 2 years ago
- 使用scrapy从全国六大较权威的新闻网站(澎湃新闻、新华网、新京报、凤 凰网、光明网、人民网)爬取最近15天内的新闻,利用爬取数据提取省份信息、计算新闻热点值、使用预训练模型生成新闻类别后存入Mysql数据库,网页使用HTML、CSS、JavaScript进行编写,采用开…☆28Updated 2 years ago
- 参与针对于2019-nCoV数据可视化预测项目,后端完全使用ElasticSearch集群/Redis缓存,利用Flask提供API Server,利用前端/中后/前台的接口配合完成新型冠状病毒的疫情发展的相关信息可视化以及预测,方便观察疫情发展情况,并结合机器学习模型对疫…☆23Updated 5 years ago
- 公司、企业名称模糊匹配,基于词频的公司名主体提取,基于编辑距离的匹配度☆41Updated 4 years ago
- boss直聘爬虫,boss,招聘,数据可视化,pyecharts,selenium ,xpath☆25Updated 4 years ago
- 基于BOSS直聘上海地区岗位信息,利用爬虫对数据进行爬取和存储后,对其进行自然语言分析。提取“职位描述”中的软件技能,并建模预测分析。调参后的最终模型薪资预测误差约±4.3k。☆26Updated 6 years ago
- 爬取新浪微博数据并可视化分析☆39Updated 4 years ago
- 今日热榜项目TopList的Python实现,异步爬取微博热榜,知乎 ,V2EX,GIthub,通过Flask展示。☆71Updated 5 years ago
- 目前任职大数据开发工作,日常开发使用Python作为数据分析工具,在此比较常用的方面知识或难点总结、整理出来,以此分享,谢谢!☆18Updated 7 years ago
- 各种爬虫:爱企查爬虫,网上114企业信息爬虫,抖音视频爬虫,wipo爬虫, 专利信息爬虫(patentscope)☆74Updated 3 years ago
- 分布式采集拉钩网中杭州爬虫相关职位的数据并使用Flask进行数据的可视化与分析☆37Updated 7 years ago
- python办公自动化☆19Updated 4 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆66Updated 4 years ago
- 新浪爬虫,基于Python+Selenium。模拟登陆后保存cookie,实现登录状态的保存。可以通过输入关键词来爬取到关键词相关的热门微博。☆30Updated 6 years ago
- 大众点评商家评论爬虫☆48Updated 5 years ago
- 基于Scrapy和Django的二手房爬虫及可视化☆10Updated 2 years ago
- 包含leleketang.com做文库十万余条作文信息,每条作文包含标题、作者、时间、地点、正文、评语、等级等信息。根据文本数据,从多个维度对数据进行分析,并用python中的pyecharts绘制图表。使用TF-IDF和Doc2Vec模型统计关键词☆14Updated 5 years ago