documentationから、ノードがmesosノードに入るとメンテナンスモードになり、すべてのフレームワークに逆オファーが送信されるようです。私の解釈は、Marathonのようなフレームワークは、その逆のオファーを受け取り、メンテナンス予定のノードからタスクを移行するように働かなければならないということです。mesosノードから移動しないマラソンタスクは、ドレインモードになる
私は今APIを使用してから60秒間のメンテナンスをスケジュール:、私はメンテナンスの状況を照会し、それが排水されていることを確認することができます次に
curl -X POST leader.mesos:5050/maintenance/schedule \
--data '{"windows": [{"machine_ids":[{"hostname": "host43.local"}], "unavailability": {"start": {"nanoseconds": '$(($(date +%s) + 60))'000000000}, "duration": {"nanoseconds": 3600000000000}}}]}'
:最後に
$ curl leader.mesos:5050/maintenance/status | jq .
{
"draining_machines": [
{
"id": {
"hostname": "host43.local"
}
}
]
}
を、窓たらアプローチ:私はそれをダウン:
curl -X POST leader.mesos:5050/machine/down --data '[{"hostname": "host43.local"}]'
私はそれが有効になったことを確認します:
次に、(UIを介して)マラソンをチェックし、まだhost43.local
で実行中のタスクがあることを確認します。
私はマラソンログにこのエラーメッセージが表示され、それが関連している場合、私は疑問に思う:
May 12 11:46:02 host43.local start[126170]: [2016-05-12 11:46:02,581] ERROR not currently active (Actor[akka://marathon/user/taskTracker#-1732573467]) (akka.actor.OneForOneStrategy:marathon-akka.actor.default-dispatcher-17)
May 12 11:46:02 host43.local start[126170]: java.lang.IllegalStateException: not currently active (Actor[akka://marathon/user/taskTracker#-1732573467])
May 12 11:46:02 host43.local start[126170]: at mesosphere.marathon.core.leadership.impl.WhenLeaderActor$$anonfun$1.applyOrElse(WhenLeaderActor.scala:38) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at akka.actor.Actor$class.aroundReceive(Actor.scala:465) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at mesosphere.marathon.core.leadership.impl.WhenLeaderActor.aroundReceive(WhenLeaderActor.scala:20) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at akka.actor.ActorCell.receiveMessage(ActorCell.scala:516) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at akka.actor.ActorCell.invoke(ActorCell.scala:487) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at akka.dispatch.Mailbox.processMailbox(Mailbox.scala:254) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at akka.dispatch.Mailbox.run(Mailbox.scala:221) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at akka.dispatch.Mailbox.exec(Mailbox.scala:231) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at scala.concurrent.forkjoin.ForkJoinTask.doExec(ForkJoinTask.java:260) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at scala.concurrent.forkjoin.ForkJoinPool$WorkQueue.runTask(ForkJoinPool.java:1339) ~[marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at scala.concurrent.forkjoin.ForkJoinPool.runWorker(ForkJoinPool.java:1979) [marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: at scala.concurrent.forkjoin.ForkJoinWorkerThread.run(ForkJoinWorkerThread.java:107) [marathon-assembly-1.1.1.jar:1.1.1]
May 12 11:46:02 host43.local start[126170]: [2016-05-12 11:46:02,581] INFO Killing 1 instances from 1 (mesosphere.marathon.upgrade.TaskKillActor:marathon-akka.actor.default-dispatcher-17)
私は手動マラソンでタスクを殺すならば、彼らはノード受けに割り当てられて取得する表示されません。メンテナンス。ノードが自動的に移行されるような振る舞いでなければならないし、何が間違っているのか、バグに遭遇したのか、ドキュメントや予想される振る舞いを誤解しているのか分からない。
DC/OSたるみチャットルームからの回答を受信マラソン1.1.1とMesos 0.28