ブール値のデータフレームが1 * 20000列あります。 データフレーム(551行* 20000列)の列を選択するには、これらのブール値が必要です。別のデータフレームのブール値を使用したpandas列の選択
[In] web.shape
[Out] (550, 20000)
[In] language.shape
[Out] (1, 20000)
[In] language
[Out] Index(['zh', 'zh', 'zh', 'zh', 'zh', 'zh', 'zh', 'zh', 'zh', 'zh',
...'na', 'na', 'na', 'na', 'na', 'na', 'na', 'na', 'na', 'na'],
dtype='object', name='Page', length=20000)
今、私は言語は中国(「亜鉛」)であるウェブのこれらの列を取り出したいのですつまり、言語の列の位置がTRUE .Iどこがそれらを必要とします列はと別のデータフレームです。列の名前は、Webと言語で異なります。
[In] language=pd.DataFrame(language)
[In] English =web.iloc[:,language=='zn']
[Out] ValueError: Buffer has wrong number of dimensions (expected 1, got 2)
エラーが言語データフレームのインデックスによって発生していることがわかりました。私はそれを避けるための良い解決策がなければならないと考えています。ありがとうございました。
これまでに何を試しましたか? –
Stack Overflowへようこそ。[welcomeツアー](https://stackoverflow.com/tour)にアクセスして、ここであなたのやり方を知る(また、最初のバッジを獲得する)時間を取ってください。最小限で完全で検証可能な例](https://stackoverflow.com/help/mcve)を参照してください。また、[How to Ask Good Questions](https://stackoverflow.com/help/how-to-ask)もチェックしてください。あなたはフィードバックと有用な答えを得る機会を増やします。 –
@greg_dataに説明とコードが追加されました。ありがとうございました –