数据基本清洗包括日期、时间、数值、字符串、字符、金钱、数据库(mysql、postgresql、mongodb、hbase、hdfsmemcached)、加解密(md5、sha、base64、aes、rsa)、文件、http服务、正则表达式等,后期会不断更新。
☆13Jul 25, 2018Updated 7 years ago
Alternatives and similar repositories for ETL-1
Users that are interested in ETL-1 are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- 当今海量的移动应用跟人们的生活、工作、学习、休闲、娱乐等方面密切相关,发挥着重要作用。多数APP在安装、更新时,都会向用户申请相关手机权限。多数终端用户缺乏鉴别APP所请求的权限是否合理的能力,并且APP安装使用过程中过度索要权限现象较为普遍,这就给用户数据安全、隐私信息泄…☆13Feb 11, 2020Updated 6 years ago
- 反洗钱使用黑名单数据爬取☆13Jul 7, 2015Updated 10 years ago
- A web spider based on electron☆10Oct 22, 2020Updated 5 years ago
- AiBal 是一款 菜单栏应用,为 AI 重度用户提供统一的多服务用量监控平台。☆25Jan 2, 2026Updated 3 months ago
- A WebUI Demo (PyQt5)☆14Nov 28, 2018Updated 7 years ago
- Managed hosting for WordPress and PHP on Cloudways • AdManaged hosting for WordPress, Magento, Laravel, or PHP apps, on multiple cloud providers. Deploy in minutes on Cloudways by DigitalOcean.
- This project contains source code to demonstrate the usage of Retrival Augmented Generation (RAG) feature using Spring AI using PG Vector…☆29Mar 15, 2025Updated last year
- 前端项目开发规范,借鉴行业标准,适用于各个前端团队☆10Jul 27, 2022Updated 3 years ago
- 📚 A Go port for caj2pdf/caj2pdf☆10Feb 23, 2023Updated 3 years ago
- 基于 Claude Code 和 Exa 搜索引擎的 AI 驱动企业与市场研究工具。核心特性 - **智能公司研究**: 自动收集公司信息、新闻、社交媒体动态、财务数据和 LinkedIn 资料 - **竞争对手分析**: 快速构建竞争对手列表,分析市场定位 - **市场…☆35Apr 10, 2026Updated last week
- Repository for the "C# Intermediate: Learn OOP in C# with .NET Core" course.☆17Jul 23, 2021Updated 4 years ago
- 多Agent驱动的实时广播电台 实验性项目☆33Feb 8, 2026Updated 2 months ago
- leveldbd是一个nosql数据库,底层使用leveldb作为存储引擎,提供REST接口☆12Jun 18, 2015Updated 10 years ago
- 一个仿百度云盘面向 C 端用户的网盘项目,包括用户注册,QQ 快捷登绿,文件上传,分片上传,新点续传, 秒传,文件在线预览,包括文本,图片,视领,音领,excel,,word,pdf 等文件在线预览,文件分享等功能。☆12Nov 4, 2023Updated 2 years ago
- 一个免费的双栏型markdown编辑器。A free two-column Markdown editor.☆29Feb 5, 2026Updated 2 months ago
- Managed Kubernetes at scale on DigitalOcean • AdDigitalOcean Kubernetes includes the control plane, bandwidth allowance, container registry, automatic updates, and more for free.
- 亿矿云大数据处理框架:借助Hadoop、Spark、Storm等分布式处理架构,满足海量数据的批处理和流处理计算需求。 亿矿云大数据预处理:运用数据冗余剔除、异常检测、归一化等方法对原始数据进行清洗,为后续存储、管理与分析提高质量数据来源。 亿矿云大数据存储与管理:通过分布…☆19Sep 9, 2023Updated 2 years ago
- 这里将paddle中的ocr等模型转为onnx格式,并利用java版深度框架djl加载这些onnx模型进行推理预测尝试。☆14Nov 15, 2022Updated 3 years ago
- spring boot 相关使用代码☆11May 26, 2018Updated 7 years ago
- ☆12Oct 12, 2021Updated 4 years ago
- ☆76Updated this week
- 基于 Gemini Live API 的实时语音合成工具 | Real-time text-to-speech powered by Gemini Live API☆19Dec 28, 2025Updated 3 months ago
- 又一个newapi的二开☆19Mar 30, 2026Updated 2 weeks ago
- Aurora MBTI 是一个基于人工智能的现代化 MBTI 人格测试平台,通过深度个性化和智 能算法优化,为用户提供更精准、更贴合个人生活的性格分析体验。☆29Updated this week
- 基于nginx lua做前端防御,基于hadoop做用户行为分析的waf☆11Nov 17, 2016Updated 9 years ago
- Deploy open-source AI quickly and easily - Bonus Offer • AdRunpod Hub is built for open source. One-click deployment and autoscaling endpoints without provisioning your own infrastructure.
- ☆19Dec 19, 2025Updated 4 months ago
- Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优…☆12Mar 9, 2017Updated 9 years ago
- Database persistence layer tool based auto-gen JDBC code☆13Nov 5, 2025Updated 5 months ago
- 基于spring boot + quartz + redis实现job任务调度,前端使用vue和element-ui实现页面控制台。☆13Jan 30, 2019Updated 7 years ago
- 一个基于Python的微信AI女友机器人,使用豆包(Doubao)API实现智能对话。☆22Dec 27, 2025Updated 3 months ago
- ☆10Aug 14, 2019Updated 6 years ago
- Apifox MCP 服务器 - 让 Claude 等 AI 助手通过自然语言管理你的 Apifox 项目,轻松创建、更新和审计 API 接口☆31Dec 18, 2025Updated 4 months ago
- 一款用于chatgpt-on-wechat的简易的提示词保护插件。☆13Apr 20, 2024Updated last year
- 微信公众号MCP服务器 - WeChat Official Account MCP Server☆37Feb 16, 2026Updated 2 months ago
- Simple, predictable pricing with DigitalOcean hosting • AdAlways know what you'll pay with monthly caps and flat pricing. Enterprise-grade infrastructure trusted by 600k+ customers.
- 聚合支付是一种第四方支付服务。简而言之,第三方支付提供的是资金清算通道,而聚合支付提供的是支付基础之上的多种衍生服务。聚合支付服务”不具备支付牌照,而是通过聚合多种第三方支付平台、合作银行及其他服务商接口等支付工具的综合支付服务。聚合支付不进行资金清算,但能够根据商户的需求…☆18May 30, 2024Updated last year
- 电报图片批量下载☆46Nov 19, 2020Updated 5 years ago
- “达观杯”长文本智能处理挑战赛。达观数据提供了一批长文本数据和分类信息,希望选手动用自己的智慧,结合当下最先进的NLP和人工智能技术,深入分析文本内在结构和语义信息,构建文本分类模型,实现精准分类。☆10Jul 20, 2018Updated 7 years ago
- TensorFlow: learn and practice☆11Aug 30, 2018Updated 7 years ago
- A modern multi-platform note-taking application built with Electron, featuring local data storage for complete security and control.☆30Updated this week
- micro-job是一款轻量级的分布式任务执行框架,内部集成了quartz框架来完成任务的分布式调度,quartz是一个强大的任务执行框架,但是quartz为我们提供的功能却是有限,我们较为关心的执行日志采集、任务失败重试、任务权重调度等,在原生的quartz框架内实现会较…☆15Jan 22, 2019Updated 7 years ago
- 小星星点起,谢谢哈~html5的多个video标签:截取视频源的封面图poster;增加监听视频播放状态的功能;☆10Feb 23, 2021Updated 5 years ago