2016-06-27 6 views
0

以下のように散発的な例外が発生しました。Apache Flink: "チェックポイントバリアを受信した結果、チェックポイントをトリガーするエラー"

java.lang.RuntimeException: Error triggering a checkpoint as the result of receiving checkpoint barrier 
    at org.apache.flink.streaming.runtime.tasks.StreamTask$2.onEvent(StreamTask.java:701) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask$2.onEvent(StreamTask.java:691) 
    at org.apache.flink.streaming.runtime.io.BarrierBuffer.processBarrier(BarrierBuffer.java:203) 
    at org.apache.flink.streaming.runtime.io.BarrierBuffer.getNextNonBlocked(BarrierBuffer.java:129) 
    at org.apache.flink.streaming.runtime.io.StreamInputProcessor.processInput(StreamInputProcessor.java:175) 
    at org.apache.flink.streaming.runtime.tasks.OneInputStreamTask.run(OneInputStreamTask.java:65) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask.invoke(StreamTask.java:225) 
    at org.apache.flink.runtime.taskmanager.Task.run(Task.java:559) 
    at java.lang.Thread.run(Thread.java:745) 
Caused by: java.lang.RuntimeException: Failed to fetch state handle size 
    at org.apache.flink.runtime.taskmanager.RuntimeEnvironment.acknowledgeCheckpoint(RuntimeEnvironment.java:234) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask.performCheckpoint(StreamTask.java:528) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask$2.onEvent(StreamTask.java:695) 
    ... 8 more 
Caused by: java.io.FileNotFoundException: No such file or directory 's3n://xxxx/flink/datum/checkpoints/5bdceb1b79bd568de16fe82b01887b96/chk-14046/ee6d12f7-9b96-4f86-b66a-00ccdd23a8cc' 
    at org.apache.hadoop.fs.s3native.NativeS3FileSystem.getFileStatus(NativeS3FileSystem.java:507) 
    at org.apache.flink.runtime.fs.hdfs.HadoopFileSystem.getFileStatus(HadoopFileSystem.java:351) 
    at org.apache.flink.runtime.state.filesystem.AbstractFileStateHandle.getFileSize(AbstractFileStateHandle.java:93) 
    at org.apache.flink.runtime.state.filesystem.AbstractFsStateSnapshot.getStateSize(AbstractFsStateSnapshot.java:134) 
    at org.apache.flink.streaming.runtime.tasks.StreamTaskStateList.getStateSize(StreamTaskStateList.java:87) 
    at org.apache.flink.runtime.taskmanager.RuntimeEnvironment.acknowledgeCheckpoint(RuntimeEnvironment.java:231) 
    ... 10 more 

ただし、ファイルがあります。この問題を解決するにはどうすればよいですか?

+0

flinkバージョンは1.0.3です。 – OnlyUno

+0

最近Flink 1.1.3でこの問題が発生しました。私はそれがS3の最終的な一貫性モデルと関係があると推測していますが、わかりません。 – Shannon

答えて

0

このFlink JIRAの問題https://issues.apache.org/jira/browse/FLINK-4218で問題が説明されているようですが、これはディレクトリベースの操作を実行する際にS3矛盾の問題として記述されています。 JIRAの問題によると、それはFlink 1.2と1.1.4(両方とも未リリース)で解決されました。

関連する問題