Apache Toree-PySparkでJupyter(v4.2.1)を実行しています。 import numpy as np
import pandas as pd
import plotly.plotly as py
import plotly.graph_objs as go
from plotly import tools
from plotly.offline import
Apache Toreeを使用すると、Sparkで任意の式を実行できます。 sqlContext.sql(..) このようなSQLクエリで進捗状況(Zeppelinなど)を取得することは可能ですか?たぶんToreeはいくつかのクエリメトリック(X tasks from N are doneなど)を提供することができますか?