文字列が列の値である行をフィルタリングする場合は、data.sample_id.str.contains('hph')
(前に回答:check if string in pandas dataframe column is in list、またはCheck if string is in a pandas dataframe)などを使用できます。pandas stringにルックアップが含まれています:NaNが値エラーにつながります
ただし、私のルックアップ列にはemtpyセルが含まれています。その結果、str.contains()
はNaN
の値になり、インデックス作成時に値のエラーが発生します。
`ValueError: cannot index with vector containing NA/NaN values``
何が動作します:
# get all runs
mask = [index for index, item in enumerate(data.sample_id.values) if 'zent' in str(item)]
これより(str.contains()
と同様)よりエレガントかつ迅速に方法はありますか?