私は "sentences"というデータフレームを持っており、そこからキーワードを検索したいと考えています。私のキーワードが文字「A」であるとしましょう。サンプルデータ:あるPython pandas counting
year | sentence | index
-----------------------
2015 | AAX | 0
2015 | BAX | 1
2015 | XXY | -1
2016 | AWY | 0
2017 | BWY | -1
、「インデックス」欄には、各文章で「A」の最初の出現の指標を示す(-1見つからない場合)。列をそれぞれの年のレコードにグループ化し、それぞれのレコードの「A」の発生率を示す列を作成します。それは次のとおりです。
year | index
-------------
2015 | 0.667
2016 | 1.0
2017 | 0
私は、これはいくつかの方法でagg
またはgroupby
を含むが、どのように一緒に文字列にこれらをする私は明確ではないんだという気持ちを持っています。私が得ている限り:ここでの問題は、()最初に、私たちは最初に、その分割し、「A」を含む年間201Xの行数を数えるところ、条件数のいくつかの種類
df.groupby("index").count()
しかしあります201X年の行数で表します。