私はスカラの初心者です。データセットをのペアにマップすることです。ここで、kv(0)
とkv(1)
は文字列で、kv(2)
はリストです。データセット内kv(2)
のためのいくつかの空のリストがあり、スカラを使用してスパークしたアウトオブバウンド例外
val rdd_q1_bs = rdd_business.map(lines => lines.split('^')).map(kv =>
(kv(0), (kv(1), kv(2))))
しかし、ここで問題です:コードが下に表示されます。したがって、すべての要素を集めるのに.collect()
を使用すると、範囲外の例外が発生する可能性があります。 私が考えているのは、機能を定義し、長さを確認することですkv
。私は例外を無視してプロセスを維持するか、kv(2)
をStringに置き換えることができる簡単な方法はありますか?
これは本当に役に立ちます、感謝〜 –