しばらく前に、ラムダ関数をユーザーから受け取りました。パンダのラムダ関数表記
actresses_modified['Winner_Count'] = actresses_modified.apply(lambda x: actresses_modified.Name.value_counts()[x.Name], axis=1)
、それが適用されたデータフレームは次のようになります。
Year Award Winner Name
2 1928 Best Actress 0.0 Louise Dresser
3 1928 Best Actress 1.0 Janet Gaynor
4 1928 Best Actress 0.0 Gloria Swanson
40 1929 Best Actress 0.0 Ruth Chatterton
41 1929 Best Actress 0.0 Betty Compson
問題は、私はそれがどのように動作するか忘れてしまったです(私は離れて、この「楽しみのために」プロジェクトからステップしなければならなかった)と、具体的には、正確に何が起こっているのか[x.Name]
です。
actresses_modified.Name.value_counts()
という行だけで、データフレーム内のすべての女優名の数がわかります。 [x.Name]は英語で何を意味しますか?データフレームのWinner列にある各人の名前の横にある1をすべて集計して、合計得点を正確に返します。同じように重要なのは、このタイプの構文には名前がありますか?私のGoogle検索はnadaになった。
どのようなご意見をいただければ幸いですか?
私は今パンダとnumpyになっていますが、ラムダがデータフレーム内の各項目に適用されて呼び出されるように見えます'value_counts'メソッドを呼び出し、データフレームから各女優を名前(' x.Name')で取得します。したがって、 'value_counts'がデータを保存しない限り、毎回不必要な作業をしているようです。それはあなたに理にかなっていますか?私はそれに関して何の経験もないかもしれませんが、私は95%のようなことが起こっていると確信しています。 –