Apache Flink®

数据流上的有状态计算

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

Flink Capabilities
正确性保证

Exactly-once 状态一致性

事件时间处理

成熟的迟到数据处理

分层 API

SQL on Stream & Batch Data

DataStream API

ProcessFunction (Time & State)

聚焦运维

灵活部署

高可用

保存点

大规模计算

水平扩展架构

支持超大状态

增量检查点机制

性能卓越

低延迟

高吞吐

内存计算

所有流式场景
事件驱动应用

事件驱动型应用是一类具有状态的应用,它从一个或多个事件流提取数据,并根据到来的事件触发计算、状态更新或其他外部动作。

流批分析

Analytical jobs extract information and insight from raw data. Apache Flink supports traditional batch queries on bounded data sets and real-time, continuous queries from unbounded, live data streams.

数据管道 & ETL

提取-转换-加载(ETL)是一种在存储系统之间进行数据转换和迁移的常用方法。

最新博客列表
Preview Release of Apache Flink 2.0

2024年10月23日 - Xintong Song.

The Apache Flink community is actively preparing Flink 2.0, the first major release since Flink 1.0 launched 8 years ago. As a significant milestone, Flink 2.0 is set to introduce numerous innovative …

Continue reading
Apache Flink CDC 3.2.0 Release Announcement

2024年9月5日 - Xiqian Yu. Qingsheng Ren.

The Apache Flink Community is excited to announce the release of Flink CDC 3.2.0! This release aims to improve usability and stability of existing features, including transform and schema evolution. …

Continue reading
Announcing the Release of Apache Flink 1.20

2024年8月2日 - Weijie Guo. Rui Fan.

The Apache Flink PMC is pleased to announce the release of Apache Flink 1.20.0. As usual, we are looking at a packed release with a wide variety of improvements and new features. Overall, 142 people …

Continue reading