【数据中台】开源项目(3)-Linkis

75 篇文章 4 订阅
订阅专栏
21 篇文章 0 订阅
订阅专栏

关于 Linkis

      Linkis 在上层应用程序和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/Hive/Presto/Flink 等底层引擎,同时实现统一变量、脚本、用户定义函数和资源文件等用户资源的跨上层应用互通,以及通过REST标准接口提供了数据源管理和数据源对应的元数据查询服务。 作为计算中间件,Linkis 提供了强大的连通、复用、编排、扩展和治理管控能力。通过将应用层和引擎层解耦,简化了复杂的网络调用关系,降低了整体复杂度,同时节约了整体开发和维护成本。

     Linkis 自2019年开源发布以来,已累计积累了700多家试用企业和1000多位沙盒试验用户,涉及金融、电信、制造、互联网等多个行业。许多公司已经将Linkis 作为大数据平台底层计算存储引擎的统一入口,和计算请求/任务的治理管控利器。

     开源地址:GitHub - apache/linkis: Apache Linkis builds a computation middleware layer to facilitate connection, governance and orchestration between the upper applications and the underlying data engines.

核心特点

  • 丰富的底层计算存储引擎支持:Spark、Hive、Python、Shell、Flink、JDBC、Pipeline、Sqoop、OpenLooKeng、Presto、ElasticSearch、Trino、SeaTunnel 等;

  • 丰富的语言支持:SparkSQL、HiveSQL、Python、Shell、Pyspark、Scala、JSON 和 Java 等;

  • 强大的计算治理能力: 能够提供基于多级标签的任务路由、负载均衡、多租户、流量控制、资源控制等能力;

  • 全栈计算存储引擎架构支持: 能够接收、执行和管理针对各种计算存储引擎的任务和请求,包括离线批量任务、交互式查询任务、实时流式任务和数据湖任务;

  • 统一上下文服务:支持跨用户、系统、计算引擎去关联管理用户和系统的资源文件(JAR、ZIP、Properties 等),结果集、参数变量、函数、UDF等,一处设置,处处自动引用;

  • 统一物料: 提供了系统和用户级物料管理,可分享和流转,跨用户、跨系统共享物料;

  • 统一数据源管理: 提供了Hive、ElasticSearch、Mysql、Kafka、MongoDB 等类型数据源信息的增删查改、版本控制、连接测试和对应数据源的元数据信息查询能力;

  • 错误码能力:提供了任务常见错误的错误码和解决方案,方便用户自助定位问题;

支持的引擎类型

引擎名

支持底层组件版本

Linkis 1.X 版本要求

是否默认包含在发布包中

说明

Spark

Apache 2.0.0~2.4.7,

CDH >= 5.4.0,

(默认Apache Spark 2.4.3)

>=1.0.0_rc1

Spark EngineConn, 支持SQL, Scala, Pyspark 和R 代码。

Hive

Apache >= 1.0.0,

CDH >= 5.4.0,

(默认Apache Hive 2.3.3)

>=1.0.0_rc1

Hive EngineConn, 支持HiveQL 代码。

Python

Python >= 2.6,

(默认Python2*)

>=1.0.0_rc1

Python EngineConn, 支持python 代码。

Shell

Bash >= 2.0

>=1.0.0_rc1

Shell EngineConn, 支持Bash shell 代码。

JDBC

MySQL >= 5.0, Hive >=1.2.1,

(默认Hive-jdbc 2.3.4)

>=1.0.0_rc1

JDBC EngineConn, 已支持Mysql,Oracle,KingBase,PostgreSQL,SqlServer,DB2,Greenplum,DM,Doris,ClickHouse,TiDB,Starrocks,GaussDB和OceanBase, 可快速扩展支持其他有JDBC Driver 包的引擎, 如SQLite

Flink

Flink >= 1.12.2,

(默认Apache Flink 1.12.2)

>=1.0.2

Flink EngineConn, 支持FlinkSQL 代码,也支持以Flink Jar 形式启动一个新的Yarn 应用程序。

Pipeline

-

>=1.0.2

Pipeline EngineConn, 支持文件的导入和导出。

openLooKeng

openLooKeng >= 1.5.0,

(默认openLookEng 1.5.0)

>=1.1.1

openLooKeng EngineConn, 支持用Sql查询数据虚拟化引擎openLooKeng。

Sqoop

Sqoop >= 1.4.6,

(默认Apache Sqoop 1.4.6)

>=1.1.2

Sqoop EngineConn, 支持 数据迁移工具 Sqoop 引擎。

Presto

Presto >= 0.180

>=1.2.0

Presto EngineConn, 支持Presto SQL 代码。

ElasticSearch

ElasticSearch >=6.0

>=1.2.0

ElasticSearch EngineConn, 支持SQL 和DSL 代码。

Trino

Trino >=371

>=1.3.1

Trino EngineConn, 支持Trino SQL 代码

Seatunnel

Seatunnel >=2.1.2

>=1.3.1

Seatunnel EngineConn, 支持Seatunnel SQL 代码

linkis架构

     Linkis 基于微服务架构开发,其服务可以分为3类:计算治理服务、公共增强服务和微服务治理服务。

  • 计算治理服务,支持计算任务/请求处理流程的3个主要阶段:提交->准备->执行。

  • 公共增强服务,包括上下文服务、物料管理服务及数据源服务等。

  • 微服务治理服务,包括定制化的Spring Cloud Gateway、Eureka、Open Feign。

     下面是Linkis的架构概要图: 

     基于Linkis 计算中间件,我们在大数据平台套件 WeDataSphere 中构建了许多应用和工具系统,下面是目前可用的开源项目。

  • DataSphere Studio  - 数据应用集成开发框架

  • Scriptis  - 数据研发IDE工具

  • Visualis  - 数据可视化工具

  • Schedulis  - 工作流调度工具

  • Qualitis  - 数据质量工具

  • MLLabis  - 容器化机器学习notebook 开发环境

开源项目-智数通数据台管理系统
u010479989的博客
03-15 4043
智数通数据台管理系统
数据挖掘开源项目立项
03-23 2193
项目背景 因为最近一直都在搞数据挖掘类的项目,且现在国内的大数据潮火热。在前几天与群里的几位兄弟聊天所以有了做一个开源项目的想法,以前也搞过一个开源项目,当时只是想把权限集化做一下,项目的名称和地址是: http://www.cnblogs.com/skyme/archive/2012/02/07/2341364.html 但是后期实在工作太忙,就搁置在那里了。 所以现在又搞...
功能强大的开源数据台系统 DataCap 2024.03.1 发布
最新发布
qianmoQ - 关注云计算,关注大数据
04-11 330
推荐一套基于 SpringBoot 开发的简单、易用的开源权限管理平台,建议下载使用:本次版本更新,我们主要针对 UI 进行了重构。
数据台】开源项目(1)-LarkMidTable
xqdd的专栏
11-26 1397
LarkMidTable 是一站式开源数据台,实现台的 基础建设,数据治理,数据开发,监控告警,数据服务,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。满足许多的小企业,提供一站式的解决方案。做出世界级别,能够媲美BAT大厂的产品。创造价值,产生价值,让世界变得更加美好。
数据台】开源项目(2)-Dbus系统架构
xqdd的专栏
11-26 1192
大体来说,Dbus支持两类数据源:RDBMS数据源日志类数据源。
数据台】开源项目(4)-BitSail
xqdd的专栏
12-02 556
BitSail是字节跳动开源的基于分布式架构的高性能数据集成引擎, 支持多种异构数据源间的数据同步,并提供离线、实时、全量、增量场景下的全域数据集成解决方案.
Linkis-sqoop1.4.6引擎(已编译)
01-07
通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问MySQL/Spark/Hive/Presto/Flink 等底层引擎,同时实现变量、脚本、函数和资源文件等用户资源的跨上层应用互通,以及通过REST标准...
开源项目-alioygur-is.zip
09-04
开源项目-alioygur-is.zip,Micro check library in Golang.
datacenter:数据台系统,基于go-zero框架
03-11
基于go-zero框架写的一个数据心详细介绍架构图已完成的功能列表微信公众号登陆七牛上传获取令牌投票报名报名列表投票抽奖问答活动信息问答列表提交答案获取辉煌抽奖填写奖人信息搜寻基于elasticsearch未完成...
开源项目-cznic-sqlite3shell.zip
09-03
开源项目-cznic-sqlite3shell.zip,sqlite3shell is a mechanically produced Go port of shell.c, part of the SQLite project
开源项目-3zcurdia-changes-reporter.zip
09-05
开源项目-3zcurdia-changes-reporter.zip,从git提交生成变更日志的小项目
一站式开源数据台,实现元数据管理,数据仓库开发,数据质量管理,数据的可视化,实现高效赋能数据前台并提供数据服务的产品
06-02
LarkMidTable 是一站式开源数据台,实现台的基础建设,数据治理,数据开发,监控告警,数据服务,数据的可视化,实现高效赋能数据前台并提供数据服务的产品。
java报修源码下载-DataCenter:数据台产品
06-05
java报修源码下载 DataCenter Todo: CDH, hbase,zk 部署和配置。代码发布。 presto , redis集群,cachecloud 部署。 Hive 开发的流程。 azkaban安装部署。 Doubble 服务安装部署。 MySQL的在模块里的配置。 Plan: 3月底代码整体提交,做一次部署测试发现问题。 3月底验证可部署性。 4月份提供可以使用的一个版本。 4月底验证可使用性。 5,6月份主要是做一些二次开发,使得像一个真正的产品。 6月底验证产品完整性。 项目说明 项目整体架构 数据服务心管理了所有业务服务的数据访问,业务层对外提供的是dubbo接口或Rest风格接口,路由网关负责对外接口的管理,是的web应用或其他三方应用的访问具有可控性 big-cbr(报表系统) 数据报表系统,报表元数据存储在数据库,可以通过前端进行动态配置报表的样式和数据查询功能 big-dbms(数据库管理系统) 可以理解它为’一个超级大的数据访问层’,在整个项目承担了所有数据访问的工作, big-dbms-server(数据查询服务系统) 提供数据的查询功能,可集成
shuzeCloud:国内领先的数据台开发平台
03-19
数择云平台 关于我们 数择云平台是开源一站式大数据智能云开发平台。同时能满足用户对数据治理的需求,赋予用户对外提供数据服务的能力。 数择云平台是从工作室,车间到工具到都齐备的一站式大数据工场,助力您快速完成数据集成,开发,治理,服务,质量和安全等全套数据研发工作。云DataWorks,我们的目标是做开源界最好用的DataWorks 。 数择云平台与DataWorks功能对比 模块 功能点 DataWorks基础版 数择云平台 基础 工作空间数量 不限 不限 换肤 支持 规划 OpenAPI的 不支持 支持 数据集成 实时同步 支持 支持 离线同步 支持 支持 同步资源监控 不支持 支持 自定义资源组 不支持 规划 数据工作室 代码搜索 不支持 支持 多人协作 支持 支持 周期任务调度 支持 支持 业务流程 支持 支持 手动业务流程 支持 支持 发布管理 支持 支持 自定义调度资源组 不
前端开源库-tachyons-links
08-30
前端开源库-tachyons-links超光速子链接,基于性能的CSS模块。
数据台】开源项目(3)-DataSphere Studio
xqdd的专栏
12-02 1094
DataSphere Studio(简称 DSS)是微众银行自研的数据应用开发管理集成框架。基于插拔式的集成框架设计,及计算间件,可轻松接入上层各种数据应用系统,让数据开发变得简洁又易用。在统一的 UI 下,DataSphere Studio 以工作流式的图形化拖拽开发体验,将满足从数据交换、脱敏清洗、分析挖掘、质量检测、可视化展现、定时调度到数据输出应用等,数据应用开发全流程场景需求。DSS 通过插拔式的集成框架设计,让用户可以根据需要,简单快速替换 DSS 已集成的各种功能组件,或新增功能组件。
数据台】开源项目(2)-Davinci可视应用平台
xqdd的专栏
11-27 672
社交智能能力指共享优秀的数据可视化思想,激发用户对数据可视化表达能力和艺术美感的追求,同时也使 Davinci 更加智能的引导和提高用户的数据可视化能力。自由布局的 Display(大屏),适用于一些特定的、需要添加额外修饰元素的、长时间查看的场景,通常配置这类场景需要花一定的时间和精力,如“双11”大屏。一次配置即可实现可视组件高级过滤、高级控制、联动、钻取、下载、分享等,帮助业务人员快速完成对比、地理分析、分布、趋势以及聚类等分析和决策。支持大屏、PC、Pad、手机移动端等多屏自适应。
数据开源解决方案(一)
m0_60258751的博客
10-12 2955
在海量数据场景,出于稳定的要求,Spark一般用于处理数据仓库上层的查询、计算和分析操作,而底层的操作由Hive完成。Hive 适合海量数据的批处理操作场景,操作简单,容错性和扩展性好,缺点是高延迟、查询和计算都比较慢,因此Hive被广泛应用在离线计算场景,尤其是对海量数据的批处理操作和分析场景。ClickHouse 适合海量数据的大宽表(维度和指标较多的表)的灵活和随机的查询、过滤和聚合计算,写入和查询性能很好,而多表关联操作性能一般,尤其是多个数据量较大的表(即大表)关联的情况。
开源数据台框架-数据仓库设计
qq_28097847的博客
06-04 2011
适用于政务信息系统的数据仓库框架图设计及建设方法相关资料分享
数据开源项目 java
01-22
以下是一些Java开源数据项目: 1. Apache Druid:Apache Druid是一个高性能、实时分析的列式存储数据库。它可以用于快速查询和分析大规模的实时和历史数据。 2. Apache Flink:Apache Flink是一个分布式流...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 找回foxmail下的邮箱密码 21455
  • 经典工作自我鉴定范文/实习自我鉴定表 15563
  • 股票技术指标详解--移动平均线(MA) 12953
  • eclipse默认指向 WebContent 目录 修改为 webRoot 12374
  • Langchain-Chatchat-win10本地安装部署成功笔记(CPU) 9929

分类专栏

  • 职场人生
  • 软件工程 126篇
  • 领域驱动设计 85篇
  • 软件测试 40篇
  • 网络安全 20篇
  • 人工智能 10篇
  • langchain 10篇
  • 机器学习
  • 后端技术 34篇
  • Go入门
  • 大数据 21篇
  • 图数据库 8篇
  • 数据库 13篇
  • 数据中台 75篇
  • IT项目管理 10篇
  • 技术管理 1篇
  • 信息系统项目管理师 22篇
  • 前端 12篇
  • 其他 9篇
  • 行业研究-智能卡 108篇

最新评论

  • Langchain-Chatchat-win10本地安装部署成功笔记(CPU)

    树生缘: 大佬,为什么我会报这种错误呢? 2024-05-26 12:19:29 | ERROR | stderr | OSError: Incorrect path_or_model_id: ''. Please provide either the path to a local folder or the repo_id of a model on the Hub. 2024-05-26 12:19:29 | ERROR | stderr | OSError: Incorrect path_or_model_id: ''. Please provide either the path to a local folder or the repo_id of a model on the Hub. 2024-05-26 12:19:29 | ERROR | stderr | OSError: Incorrect path_or_model_id: ''. Please provide either the path to a local folder or the repo_id of a model on the Hub.

  • 【DDD】学习笔记-聚合和聚合根:怎样设计聚合?

    码农丁丁: 现在是知识搬运工,自己在实践中

  • Langchain-Chatchat-win10本地安装部署成功笔记(CPU)

    小唐学编程: +1,如何解决啊?

  • 小白学安全-漏洞编号的理解 CVE/CAN/BUGTRAQ/CNCVE/CNVD/CNNVD

    samRsa: 所有人/团队都可以申请CVE编号,但并非所有的CVE编号都有价值。 没错

  • Langchain-Chatchat-win10本地安装部署成功笔记(CPU)

    2301_80863185: 2024-04-20 21:00:08 | ERROR | stderr | OSError: Incorrect path_or_model_id: ''. Please provide either the path to a local folder or the repo_id of a model on the Hub. 运行到一半就停在这里了,大佬们这个是什么原因

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 【云原生】Kubernetes 核心概念
  • DDD学习推荐书籍
  • HugeGraph 1.3.0版本发布
2024
05月 2篇
04月 1篇
03月 5篇
02月 69篇
01月 65篇
2023年102篇
2022年2篇
2020年6篇
2018年4篇
2016年4篇
2014年11篇
2013年27篇
2012年4篇
2011年120篇
2010年2篇
2009年7篇
2008年3篇
2007年48篇
2005年2篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码农丁丁

你的认可是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司张北关键词按天计费哪家好上海企业网站改版民治网站排名优化公司柳州网站关键词优化秦皇岛阿里店铺托管徐州网站推广工具多少钱松岗优化推荐长治网站排名优化多少钱安庆网站排名优化公司岳阳网站优化按天收费哪家好昭通SEO按天扣费推荐龙岩SEO按效果付费公司福永SEO按天计费推荐商洛seo网站推广报价陇南关键词按天计费哪家好庆阳百度seo报价南阳网站推广方案公司大连网站推广系统公司江门营销型网站建设多少钱金昌品牌网站设计吉安关键词按天收费哪家好塔城网站优化软件多少钱酒泉seo推荐怀化网站制作果洛百度网站优化推荐盘锦网站优化推广崇左百度网站优化多少钱滨州网站建设设计哪家好安康企业网站建设推荐莱芜网站建设设计哪家好歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化