DataFrameがあり、1つの列が「言語」の「lang」です。2つの行の値が異なる場合、DataFrameの列/系列内の2つの行をマージ/結合する方法はありますか?
この列の2つの異なる値は、「英語」は「en」、「英国英語」は「en-gb」です。
「ES」フランス語 『のために『「スペイン語、』FRため、』などを含めて、この行の他の多数の値がありますが、
だから、このようなものになります。
user lang id
joe en 77788
jim en-gb 23323
pedro es 12134
tom en 53892
juan es 24434
phillippe fr 04211
george en-gb 99999
を
私の分析のために、enとen-gbの値を同じ "en"または "English"の値として一緒に数えたいと思っています。それらを1つにするか、enで "en-gb"の値を変更できます。
あなたは '.replace'関数を使うことができます...あなたは何を正確に求めていますか? –
言語が2文字の場合、 'df ['lang'] = df ['lang']。str [:2]' – Dark