私のつぶやきデータベースMongoDBは以下のスキーマを持っています。これは別の列のpandas Dataframeで読んでみたいと思います。また、ハッシュタグのテキストとインデックスの内部コンポーネントが必要です。Python 3.5を使ってパンダでMongoDBを読む
{
"_id" : ObjectId("5a11200441f0c41f447ce56c"),
"created" : ISODate("2017-11-19T06:09:06Z"),
"text" : "#Bitcoin Hong Kong's bitcoin businesses suffer after local bank accounts frozen ,
"username" : "PennyStocksMomo",
"hashtags" : [
{
"text" : "Bitcoin",
"indices" : [
0,
8
]
}
],
"language" : "en",
"id" : "932128582767296512",
"followers" : 5715
}
"EDIT"
私は以下のコードを使用していました。
import pandas as pd
from pymongo import MongoClient
client = MongoClient()
db = client.BitCoinDatabase
collection = db.tweets
data = pd.DataFrame(list(collection.find()))
_id created followers hashtags id language text username
0 5a11200441f0c41f447ce56c 2017-11-19 06:09:06 5715 [{'text': 'Bitcoin', 'indices': [0, 8]}] 932128582767296512 en #Bitcoin Hong Kong's bitcoin businesses suffer... PennyStocksMomo
1 5a11200441f0c41f447ce56d 2017-11-19 06:09:06 19526 [{'text': 'Bitcoin', 'indices': [0, 8]}] 932128583077675008 en #Bitcoin Hong Kong's bitcoin businesses suffer... CryptoTraderPro
私は[この](httpsを信じる:// stackoverflowの。 com/q/16249736/2901002)が役立ちます。 – jezrael
私はデータを読むことができますが、ハッシュタグのテキストと、編集のように表示されているインデックスも必要です。 –
'hashtags'は' list'の 'dict'に1行だけありますか? – jezrael