私は文字列の長さが38文字で、実際は数値です。PySparkで非常に長い文字列を整数または長整数としてキャスト
id = '678868938393937838947477478778877 .....'(38文字)
どうすれば長い整数にキャストできますか?私はIntegerType、LongTypeとDoubleTypeでキャスト関数を試してみましたが、カラムを表示しようとするとNullsが返されます。
これは、この列を使用して内部ジョインを行う必要があるためです。なぜなら、StringがJava Heap Space Errorsを与えているからです。
Long Integerとしてキャストする方法についてのご意見はありますか? {この質問は文字列を長整数にキャストしようとします}
python 2.7を使用して再現できません。int(id)を実行しても問題ありません。 –
あなたは何を試してみましたか? –
[データフレーム列をpysparkのString型からDouble型に変更する方法](http://stackoverflow.com/questions/32284620/how-to-change-a-dataframe-column-from-string-type) -to-double-type-in-pyspark) –