0xqq / ETL-1Links
数据基本清洗包括日期、时间、数值、字符串、字符、金钱、数据库(mysql、postgresql、mongodb、hbase、hdfsmemcached)、加解密(md5、sha、base64、aes、rsa)、文件、http服务、正则表达式等,后期会不断更新。
☆12Updated 7 years ago
Alternatives and similar repositories for ETL-1
Users that are interested in ETL-1 are comparing it to the libraries listed below
Sorting:
- 自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 http://hanlp.com/☆41Updated 6 years ago
- ETL Tools 数据抽取-转换-加载工具☆79Updated 8 years ago
- 数据采集平台zdh,etl 处理服务☆73Updated 2 months ago
- 专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类和文本分类. 为相关领域的研发人员提供完整的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSe…☆117Updated 2 years ago
- SpringBoot集成neo4j实现关系网创建和查询☆10Updated 6 years ago
- springBoot的简单整合neo4j☆13Updated 6 years ago
- springboot+drools7规则引擎,MySQL实现规则引擎的编译和加载☆91Updated 2 years ago
- 数据库管理系统(DMS)一个可在web上进行数据库管理的平台, 功能包括数据源管理, 对应数据源表结构设计, 提供AceEditor进行数据查询, 表结构可以使用页面进行设计, 也可以自定义SQL 进行设计.你可以把他理解成web版本的workbench, naivcat☆44Updated 4 years ago
- 以Spring Boot框架为载体,通过集成hanLP、neo4j、spark-mllib实现基于电影知识图谱的简易问答系统。☆62Updated 2 years ago
- zdh系列-基于java的经营风控引擎☆12Updated last month
- Ruisi BI open source version, based on Springboot construction, rapid data analysis and visualisation, 0 code writing.☆82Updated last year
- 基于kettle8.0的作业/转换管理框架☆34Updated 7 years ago
- 百科名医的数据爬虫,科室、疾病、症状、检查等类型,包括医疗百科。☆11Updated 7 years ago
- 易水公共组件是基于springboot的高度封装的通用型组件,在对spring security和spring security oauth2高度可定制化的功能封装外,还支持第三方登录和sso单点登录功能,使用户能够快速开启QQ登录和微信登录能力,搭建属于自己的认证/授权中…☆23Updated 9 months ago
- 🇨🇳🇬🇧Chinese and English word spelling corrector.(中文易错别字检测,中文拼写检测纠正。英文单词拼写校验工具)☆263Updated 10 months ago
- 🔥🔥🔥支持插件化、可视化的数据异构框架mykit-data开源啦!支持MySQL到MySQL、MySQL到Oracle、Oracle到MySQL、Oracle到Oracle的全量、增量数据同步。完全的插件化、可视化操作。通过日志最大限度的避免同步过程中的数据丢失。支持…☆190Updated 2 years ago
- HanLP: Han Language Processing , Java version☆27Updated 4 years ago
- Simhash Java单机实现☆112Updated 3 years ago
- 智数通提供了元数据管理、数据标准管理、数据质量管理、主数据管理、数据集市管理、可视化图表看板、流程管理等微服务,是为数字化建设而生的企业级一站式数据治理平台。☆304Updated 8 months ago
- 基于flowable二次开发,微服务化流程引擎管理功能,提供流程模型编辑到部署监控一站式解决方案,扩展了众多官方API,提供项目微服务化集成方案。☆44Updated 4 years ago
- 本项目是基于Word分词插件实现的中文地址解析功能, 可解析出地址的省市区、行政区划代码和详细地址。地址是前置模糊匹配☆35Updated 3 years ago
- 这是一个工具程序集合,方便我们平时对数据进行预处理。针对文本处理的内容较多。包括分词(集成了张华平分词、结巴分词)、文件处理增强(如读取文本到Map中,保存文本到Map)和语料模型(把文档转换成矩阵,就算单词数量等)☆21Updated last year
- 一款基于java的,http 服务器压力测试工具☆20Updated 2 years ago
- 敏感词过滤、广告词过滤、包含敏感词库,停顿词库。☆180Updated 9 years ago
- 采用springboot2.0.5+activiti6.0.0搭建工作流微服务项目,对activiti6做了简单封装,使用起来更加方便,并对外提供了restful风格的接口。☆51Updated 11 months ago
- Flink 案例开发数据清洗、数据报表☆56Updated 3 weeks ago
- AMS实时推荐系统☆17Updated 2 years ago
- 一个通用的开源工具集,集Web、Restful服务、分布式服务、分布式数据库、分布式事务、大数据、数据分析、云计算、人工智能、深度学习、机器学习、算法等为一体的通用开源解决方案,持续更新中。。。☆78Updated 3 years ago
- ElasticFlow(伊塔)是一个开源弹性流数据交换系统,支持在任意类型数据端之间通过简单配置就可以建立可计算的弹性流管道,并进行定时、定量、高并发、多类型的交换数据服务。系统可应用于数据交换、通用搜索引擎、数据发布服务、数据仓库等项目。☆28Updated 7 months ago
- MyDataHarbor是一个致力于解决任意数据源到任意数据源的分布式、高扩展性、高性能、事务级的数据同步中间件。帮助用户可靠、快速、稳定的对海量数据进行准实时增量同步或者定时全量同步,主要定位是为实时交易系统服务,亦可用于大数据的数据同步(ETL领域)。☆84Updated last month