Employee
はJavaクラスです。スパーク:リストからオブジェクトRDDを作成<Object> RDD
私はJavaRDD<Employee[]> arrayOfEmpList
です。つまり、各RDDはarray of employees
です。
List<Employee> empList = new ArrayList<Employee>();
その後、foreachの従業員のRDD []を作成:
は、このうち、私はこれは私が試したものです、
JavaRDD<Employee>
のようなものを、従業員の単一のリストを作成したいです
arrayOfEmpList.forEach(new VoidFunction<Employee[]>(){
public void call(Employee[] arg0){
empList.addAll(Arrays.asList(arg0));
System.out.println(empList.size()); //prints correct values incrementally
}
});
System.out.println(empList.size()); //gives 0
foreachループ外のサイズを取得できません。
これを達成する別の方法はありますか?
P.S:すべての従業員レコードを別個のRDDにしたいので、第1の従業員リストは10個のレコードを含み、第2のレコードは100個のレコードを含み、第3番目のレコードは200個のレコードを含むことができる。私は330レコードの最終的なリストが欲しい。それを次に並列化してアクションを実行できる。
働いていました!リンクも見ていきます。 – gaurav5430