数据基本清洗包括日期、时间、数值、字符串、字符、金钱、数据库(mysql、postgresql、mongodb、hbase、hdfsmemcached)、加解密(md5、sha、base64、aes、rsa)、文件、http服务、正则表达式等,后期会不断更新。
☆13Jul 25, 2018Updated 7 years ago
Alternatives and similar repositories for ETL-1
Users that are interested in ETL-1 are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- ☆10Feb 5, 2026Updated last month
- 当今海量的移动应用跟人们的生活、工作、学习、休闲、娱乐等方面密切相关,发挥着重要作用。多数APP在安装、更新时,都会向用户申请相关手机权限。多数终端用户缺乏鉴别APP所请求的权限是否合理的能力,并且APP安装使用过程中过度索要权限现象较为普遍,这就给用户数据安全、隐私信息泄…☆13Feb 11, 2020Updated 6 years ago
- 反洗钱使用黑名单数据爬取☆13Jul 7, 2015Updated 10 years ago
- A web spider based on electron☆10Oct 22, 2020Updated 5 years ago
- AiBal 是一款 菜单栏应用,为 AI 重度用户提供统一的多服务用量监控平台。☆23Jan 2, 2026Updated 2 months ago
- DigitalOcean Gradient AI Platform • AdBuild production-ready AI agents using customizable tools or access multiple LLMs through a single endpoint. Create custom knowledge bases or connect external data.
- A WebUI Demo (PyQt5)☆14Nov 28, 2018Updated 7 years ago
- This project contains source code to demonstrate the usage of Retrival Augmented Generation (RAG) feature using Spring AI using PG Vector…☆29Mar 15, 2025Updated last year
- 前端项目开发规范,借鉴行业标准,适用于各个前端团队☆10Jul 27, 2022Updated 3 years ago
- 📚 A Go port for caj2pdf/caj2pdf☆10Feb 23, 2023Updated 3 years ago
- Repository for the "C# Intermediate: Learn OOP in C# with .NET Core" course.☆17Jul 23, 2021Updated 4 years ago
- 多Agent驱动的实时广播电台 实验性项目☆33Feb 8, 2026Updated last month
- leveldbd是一个nosql数据库,底层使用leveldb作为存储引擎,提供REST接口☆12Jun 18, 2015Updated 10 years ago
- 一个仿百度云盘面向 C 端用户的网盘项目,包括用户注册,QQ 快捷登绿,文件上传,分片上传,新点续传, 秒传,文件在线预览,包括文本,图片,视领,音领,excel,,word,pdf 等文件在线预览,文件分享等功能。☆12Nov 4, 2023Updated 2 years ago
- 一个免费的双栏型markdown编辑器。A free two-column Markdown editor.☆30Feb 5, 2026Updated last month
- End-to-end encrypted cloud storage - Proton Drive • AdSpecial offer: 40% Off Yearly / 80% Off First Month. Protect your most important files, photos, and documents from prying eyes.
- 亿矿云大数据处理框架:借助Hadoop、Spark、Storm等分布式处理架构,满足海量数据的批处理和流处理计算需求。 亿矿云大数据预处理:运用数据冗余剔除、异常检测、归一化等方法对原始数据进行清洗,为后续存储、管理与分析提高质量数据来源。 亿矿云大数据存储与管理:通过分布…☆19Sep 9, 2023Updated 2 years ago
- 这里将paddle中的ocr等模型转为onnx格式,并利用java版深度框架djl加载这些onnx模型进行推理预测尝试。☆13Nov 15, 2022Updated 3 years ago
- spring boot 相关使用代码☆11May 26, 2018Updated 7 years ago
- ☆12Oct 12, 2021Updated 4 years ago
- ☆19Dec 28, 2025Updated 3 months ago
- Aurora MBTI 是一个基于人工智能的现代化 MBTI 人格测试平台,通过深度个性化和智能算法优化,为用户提供更精准、更贴合个人生活的性格分析体验。☆28Updated this week
- AI模型聚合管理中转分发系统,一个应用管理您的所有AI模型,支持将多种大模型转为统一格式调用,支持OpenAI、Claude、Gemini等格式,可供个人或者企业内部管理与分发渠道使用。🍥 The next-generation LLM gateway and AI as…☆19Mar 2, 2026Updated 3 weeks ago
- 基于nginx lua做前端防御,基于hadoop做用户行为分析的waf☆11Nov 17, 2016Updated 9 years ago
- ☆20Dec 19, 2025Updated 3 months ago
- Virtual machines for every use case on DigitalOcean • AdGet dependable uptime with 99.99% SLA, simple security tools, and predictable monthly pricing with DigitalOcean's virtual machines, called Droplets.
- Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等优秀框架,让您只需要配置一些jquery风格的选择器就能很快的写出一个爬虫。Gecco框架有优…☆12Mar 9, 2017Updated 9 years ago
- Database persistence layer tool based auto-gen JDBC code☆13Nov 5, 2025Updated 4 months ago
- 基于spring boot + quartz + redis实现job任务调度,前端使用vue和element-ui实现页面控制台。☆13Jan 30, 2019Updated 7 years ago
- 一个基于Python的微信AI女友机器人,使用豆包(Doubao)API实现智能对话。☆22Dec 27, 2025Updated 3 months ago
- The sensitive word data for java.(敏感词/违禁词/违法词/脏词原始词库。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。内置支持单词标签分类分级。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤…☆22Jul 19, 2025Updated 8 months ago
- ☆23Jan 11, 2026Updated 2 months ago
- ☆10Aug 14, 2019Updated 6 years ago
- 一款用于chatgpt-on-wechat的简易的提示词保护插件。☆13Apr 20, 2024Updated last year
- Apifox MCP 服务器 - 让 Claude 等 AI 助手通过自然语言管理你的 Apifox 项目,轻松创建、更新和审计 API 接口☆28Dec 18, 2025Updated 3 months ago
- End-to-end encrypted email - Proton Mail • AdSpecial offer: 40% Off Yearly / 80% Off First Month. All Proton services are open source and independently audited for security.
- 微信公众号MCP服务器 - WeChat Official Account MCP Server☆31Feb 16, 2026Updated last month
- 电报图片批量下载☆46Nov 19, 2020Updated 5 years ago
- “达观杯”长文本智能处理挑战赛。达观数据提供了一批长文本数据和分类信息,希望选手动用自己的智慧,结合当下最先进的NLP和人工智能技术,深入分析文本内在结构和语义信息,构建文本分类模型,实现精准分类。☆10Jul 20, 2018Updated 7 years ago
- TensorFlow: learn and practice☆11Aug 30, 2018Updated 7 years ago
- 聚合支付是一种第四方支付服务。简而言之,第三方支付提供的是资金清算通道,而聚合支付提供的是支付基础之上的多种衍生服务。聚合支付服务”不具备支付牌照,而是通过聚合多种第三方支付平台、合作银行及其他服务商接口等支付工具的综合支付服务。聚合支付不进行资金清算,但能够根据商户的需求…☆18May 30, 2024Updated last year
- micro-job是一款轻量级的分布式任务执行框架,内部集成了quartz框架来完成任务的分布式调度,quartz是一个强大的任务执行框架,但是quartz为我们提供的功能却是有限,我们较为关心的执行日志采集、任务失败重试、任务权重调度等,在原生的quartz框架内实现会较…☆15Jan 22, 2019Updated 7 years ago
- A modern multi-platform note-taking application built with Electron, featuring local data storage for complete security and control.☆26Mar 22, 2026Updated last week