Apache Flink®

数据流上的有状态计算

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

Flink Capabilities
正确性保证

Exactly-once 状态一致性

事件时间处理

成熟的迟到数据处理

分层 API

SQL on Stream & Batch Data

DataStream API

ProcessFunction (Time & State)

聚焦运维

灵活部署

高可用

保存点

大规模计算

水平扩展架构

支持超大状态

增量检查点机制

性能卓越

低延迟

高吞吐

内存计算

所有流式场景
事件驱动应用

事件驱动型应用是一类具有状态的应用,它从一个或多个事件流提取数据,并根据到来的事件触发计算、状态更新或其他外部动作。

流批分析

Analytical jobs extract information and insight from raw data. Apache Flink supports traditional batch queries on bounded data sets and real-time, continuous queries from unbounded, live data streams.

数据管道 & ETL

提取-转换-加载(ETL)是一种在存储系统之间进行数据转换和迁移的常用方法。

最新博客列表
Introducing the new Prometheus connector

2024年12月5日 - Lorenzo Nicora.

We are excited to announce a new sink connector that enables writing data to Prometheus (FLIP-312). This articles introduces the main features of the connector, and the reasoning behind design …

Continue reading
Apache Flink CDC 3.2.1 Release Announcement

2024年11月27日 - Hang Ruan.

The Apache Flink Community is pleased to announce the first bug fix release of the Flink CDC 3.2 series. The release contains fixes for several critical issues and improves compatibilities with Apache …

Continue reading
Introducing the new Amazon Kinesis Data Stream and Amazon DynamoDB Stream sources

2024年11月25日 - Hong Liang Teoh.

We are pleased to introduce updated versions of the Amazon Kinesis Data Stream and Amazon DynamoDB Stream sources. Built on the FLIP-27 source interface, these newer connectors introduce 7 new …

Continue reading