私は、次のコードを持っている:scipyのダウンロード疎行列からのNaNの除去
input_data = pd.read_csv('file_name.tsv', sep='\t')
data = sparse.csr_matrix(data.values)
model = TruncatedSVD(n_components=2)
model.fit(data)
今TruncatedSVDはscipyのダウンロードからスパース行列がかかりますが、それがNaNになりません。私はcrs_matrix関数がNaNを取り除くことを期待していましたが、そうではなく、私のscipyマトリックスからこれらのNaNを取り除く方法を見つけることができません。
これを行うには良い方法はありますか?私はscipy内で機能を見つけることができません。
あなただけゼロに 'np.nan'のインスタンスを設定したいですか? –
NaNを削除することはできません。置き換えることはできます。あなたは同じコンテキストでスパース行列を使用しているので、私は、これは[XY-問題](https://meta.stackexchange.com/questions/66377/what-is-the-xy-problem)であると考えています。 * NaNを削除する理由を教えてください。 「TruncatedSVDはそれらを好きではないため、理由は十分ではありません。あなたはあなたのデータにNaN *が何を意味するのかを知る必要があります。さもなければそれらを正しく扱う方法を言う方法がない。 – kazemakase
全体の問題はナンdatpointsは未知であり、実際のゼロ値があるということです、あなたはそれをナンまたはinfの値を渡す場合、truncatedSVDは、実際にエラーが発生します。 – FlorianEn