多租户
Kyuubi 通过统一的身份验证授权层为资源获取和数据 / 元数据访问提供端到端的多租户支持。
高可用
Kyuubi 通过 ZooKeeper 提供负载均衡,它提供了企业级的高可用性,以及无限的客户端高并发。
多个工作负载
Kyuubi 可以通过一个平台、一个数据副本和一个 SQL 接口轻松支持多个不同的工作负载。
交互式分析
Kyuubi 是一个先进的企业级快速分析平台,用于对大数据进行交互式可视化分析,支持常见的计算框架,即 Apache Spark、Apache Flink、Trino 等。使用 JDBC/ODBC,用户可以直接通过 SQL 或通过 BI 工具来访问 kyuubi 并高效地运行查询。 Kyuubi 在用户级别缓存后台引擎实例,以更好的实现计算资源共享和快速响应,它们能并行处理大量数据的查询并快速返回结果。
批量处理
Kyuubi 提供了一个 SQL 接口用于常见的批处理,通常是大型提取、转换、加载 (ETL) 过程。 Kyuubi 及其引擎都是存储独立的,支持众多的数据源,并且 Kyuubi 在连接级别隔离了后台引擎实例,以便实现更好的计算资源隔离和稳定性。
数据湖和 Lakehouses
Kyuubi 支持同时查询所有传统数据仓库,如 Apache Hive/HDFS,或现代的 Lakehouse,如 Apache Iceberg、Apache Hudi 和 Delta Lake。 Kyuubi 还提供多目录元数据 API,可在用户面前呈现所有数据的大致轮廓,并帮助用户更快地进行创新。使用 ANSI 标准 SQL 语法在单个入口中查询不同数据源的能力极大地简化了数据洞察,同时提供身份验证和授权以确保所有数据的安全。