.jsonファイルからインポートしたデータセットの機能を追加する必要があります。パンダデータフレームからの辞書値の抽出
これは、それは次のようになります。本質的には
f1 = pd.read_json('https://raw.githubusercontent.com/ansymo/msr2013-bug_dataset/master/data/v02/eclipse/short_desc.json')
print(f1.head())
short_desc
1 [{'when': 1002742486, 'what': 'Usability issue...
10 [{'when': 1002742495, 'what': 'API - VCM event...
100 [{'when': 1002742586, 'what': 'Would like a wa...
10000 [{'when': 1014113227, 'what': 'getter/setter c...
100001 [{'when': 1118743999, 'what': 'Create Help Ind...
、私は列名として「SHORT_DESC」を取り、直接その下に文字列値を移入する必要があります:「ユーザビリティの問題...
はこれまでのところ、私は次のことを試してみた:
f1['desc'] = pd.DataFrame([x for x in f1['short_desc']])
Wrong number of items passed 19, placement implies 1
は、ループを使用せずにこれを達成する簡単な方法はありますか?誰かがこの初心者を正しい方向に向けることができますか?
これは、私が1、10、100などを取得している理由、そして「short_desc」と列ヘッダーがないということです。 – JohnWayne360
@ JohnWayne360あなたはシリーズをプリントアウトしているので。 'print(df.head())'を試してください。あなたはそれを得るでしょう。 –
@ JohnWayne360興味深いことに、Webリンクからロードするとインデックスが来るようです。それをリセットしたいですか? 'f1 = f1.reset_index(drop = 1)'を実行してください。 –