機械学習プロセス用の小さなキューブにxarraysを切り詰め、データなしの値でキューブをフィルタリングしようとしています。python xarrayデータセットに値が存在するかどうかをチェック
私はメモリフットプリントを小さくしておきたいと思いますし、データ値がない場合は-999の値を割り当てています。 -999はxarray.Datasetに存在するかどうかをチェックするための最良の方法は何ですか:これは物事を保つint16
代わりのnan
質問のための大きなタイプを必要とするために行われていますか?ここで
は私が持っているものです。
(dataset == -999).any()
はyeildます:私はそうvar_a
のようなものを選択しなければならないでしょう
<xarray.Dataset>
Dimensions: ()
Data variables:
var_a bool True
var_b bool True
var_c bool False
た後。私のコードは次のように見て終わるだろう:それはXarraysに来るとき
def is_clean(dataset):
return (dataset == -999).any().var_a is True
は、たぶん私はまだ新鮮だけど、私はドキュメントでこれを行うためのよりよい方法を見つけることができません。 xarraysに関する構造的知識の何ビットかが私には分かりませんが、私の現在の解決策で私が大丈夫にならないようにしていますか?何かヒント?
'return(dataset.var_a == -999).any()'? –
お返事ありがとうございます。私の問題は 'return(dataset.var_a == -999).any()'はブール値ではなく 'xr.Dataset'を返すということです。 – Conic
返される 'xr.Dataset'の次元は何ですか? –