一飞开源
阅读2015

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

一、开源项目简介

Qualitis是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。

Qualitis基于Spring Boot,依赖于Linkis进行数据计算,提供数据质量模型构建,数据质量模型执行,数据质量任务管理,异常数据发现保存以及数据质量报表生成等功能。并提供了金融级数据质量模型资源隔离,资源管控,权限隔离等企业特性,具备高并发,高性能,高可用的大数据质量管理能力。

二、开源协议

使用Apache 2.0开源协议

三、界面展示

登录

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

创建项目

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

创建规则

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

任务执行

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

任务查看

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

规则模板配置介绍

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

四、功能概述

核心特点

  • 数据质量模型定义
  • 支持以下数据模型定义:1.单表校验数据模型。2.跨表校验数据模型。3.自定义校验数据模型。同时,系统预置了多个数据质量校验模版,包括空值校验,枚举校验等常用校验,并且支持自定义数据质量模版。
  • 数据质量模型调度
  • 支持数据质量模型调度。
  • 数据质量报表
  • 支持生成数据质量报表。
  • 日志管理 日志聚合管理,方便排查数据质量任务
  • 异常数据管理 支持异常数据提取和存储,快速定位问题
  • 支持工作流 支持在工作流当中进行数据质量校验
  • 工作流必装DataSphereStudio.
  • 管理员控制台
  • 提供管理员控制台界面,支持人员管理,权限管理,权限管理,元数据管理等管理功能。

与类似系统对比

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

五、技术选型

Architecture

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

总体模块设计图

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

用例图

支持多种异构数据源的质量校验/通知/管理服务的数据质量管理平台

步骤一、基础软件安装

Gradle (4.9)

MySQL (5.5+)

JDK (1.8.0_141) Linkis(0.9.1), 必装Spark引擎。

DataSphereStudio (0.7.0) 可选. 如果你想使用工作流,必装DataSphereStudio

步骤二、安装包下载

查看底部源码地址

步骤三、编译(二进制包跳过)

gradle clean distZip

步骤四、部署

4.1 解压安装包

zip包

unzip qualitis-{version}.zip

tar包

tar -zxvf qualitis-{VERSION}.tar.gz

4.2 连接MySQL,插入初始数据。

mysql -u {USERNAME} -p {PASSWORD} -h {IP} --default-character-set=utf8
source conf/database/init.sql

4.3 修改配置文件

vim conf/application-dev.yml

修改以下配置:

## 数据库配置
spring.datasource.username=
spring.datasource.password=
spring.datasource.url=

## 数据库配置,和以上一致
task.persistence.username=
task.persistence.password=
task.persistence.address=

4.4 启动系统

dos2unix bin/*
sh bin/start.sh

Road Map

1. 支持对报表数据进行数据质量校验

  • 支持在工作流当中,对生成的报表数据进行数据质量校验

2. 支持多种数据源的数据质量校验

  • 支持HDFS, HIVE, MySQL等数据源间的数据质量校验
  • 支持实时数据的数据质量校验,如Kafka

3. 支持生成可选纬度的数据质量报表

  • 支持可选纬度生成数据质量报表

4. 支持智能发现数据质量问题

Tips

由于Qualitis的前端代码是采用WeBank自研的前端框架FES,但是FES框架目前没有开源,所以Qualitis的前端代码暂不开源。我们会尽快推进Qualitis的前端开源。对此我们感到非常抱歉。

你可以通过源码下载,并解压web/app/src/main/resources/static/static.zip来获取编译后的前端代码,或者通过下载release直接使用。

六、源码地址

源码下载


关注下面的标签,发现更多相似文章

一飞开源
发布了 篇专栏 · 获取点赞 · 获取阅读

评论

查看更多
相关推荐
关于作者
一飞开源
获得点赞 100
文章被阅读 1000
相关文章