import numpy as np
import numpy.ma as ma
"""This operates as expected with one value masked"""
a = [0., 1., 1.e20, 9.]
error_value = 1.e20
b = ma.masked_values(a, error_value)
print b
"""This does not, all values are masked """
d = [0., 1., 'NA', 9.]
error_value = 'NA'
e = ma.masked_values(d, error_value)
print e
データの欠落を示すために 'nan'、 'NA'、 'None'などの値を使用するにはどうすればよいですか?ナンシーマスクされた配列 - 欠損値を示す
私の配列(メモリ内)に欠損値情報を保存したいと思います。マスクを使用する私の目的は、欠損値を無視して配列を平均化できるようにすることです。 maドキュメントで指摘されているように、maの目的は、欠損値または無効な値を持つデータの処理を許可することです。実際のデータ系列「NA」では、欠損値をマークするために「なし」などが使用されます。 "fill_value"オプションは、私の目的を達成するための手段を提供しますか? –
@Dick:はい、上記の両方の方法が必要なものを達成します。それらは、要素3が欠落しているという情報を保持しています(fill_valueはそれほど重要でない場合はそれほど重要ではありません)。たとえば、 'a.mean()'や 'e.mean()'を呼び出して、結果が '3.33'であることを確認することができます。上記の例では、 "NA"の代わりにデータ系列が欠損値に使用する文字/文字列を使用できます。 – ars