pandas
は、をhtml table
に変換する有用なto_html()
を提供します。 DataFrame
にそれを読むための便利な機能がありますか?それは可能ではない一般的なケースではhtmlテーブルをpandasデータフレームに変換する方法
10
A
答えて
7
パンダに0.12
3
いますが、約あなたのテーブルの構造を知っていれば、あなたは可能性があり、このような何か:
# Create a test df:
>>> df = DataFrame(np.random.rand(4,5), columns = list('abcde'))
>>> df
a b c d e
0 0.675006 0.230464 0.386991 0.422778 0.657711
1 0.250519 0.184570 0.470301 0.811388 0.762004
2 0.363777 0.715686 0.272506 0.124069 0.045023
3 0.657702 0.783069 0.473232 0.592722 0.855030
今すぐHTMLを解析し、再構築:
from pyquery import PyQuery as pq
d = pq(df.to_html())
columns = d('thead tr').eq(0).text().split()
n_rows = len(d('tbody tr'))
values = np.array(d('tbody tr td').text().split(), dtype=float).reshape(n_rows, len(columns))
>>> DataFrame(values, columns=columns)
a b c d e
0 0.675006 0.230464 0.386991 0.422778 0.657711
1 0.250519 0.184570 0.470301 0.811388 0.762004
2 0.363777 0.715686 0.272506 0.124069 0.045023
3 0.657702 0.783069 0.473232 0.592722 0.855030
ます必要であればeval()
を使用してMultiindex dfsまたは自動タイプ検出のために拡張することができます。
関連する問題
- 1. htmlテーブルをpandasデータフレームに変換する
- 2. xarrayデータセットをdaskデータフレーム内のpandasデータフレームに変換する方法
- 3. HTMLでテーブルをデータフレームに変換する
- 4. pandasデータフレームをJSONに変換
- 5. Pandasデータフレーム列をnp.datetime64からdatetimeに変換する方法は?
- 6. rpy2行列オブジェクトをPandasデータフレームに変換する方法は?
- 7. Python ibis(Impala)テーブルをpandasデータフレームに変換する
- 8. pandasデータフレームをcsvに変換する
- 9. spark rddをpandasデータフレームに変換する
- 10. pandasデータフレームをオレンジデータテーブルに変換する
- 11. matファイルをpandasデータフレームに変換する
- 12. Pandas Columnをデータフレームに変換する
- 13. マッピングによるpandasデータフレームの変換
- 14. PandasデータフレームをSparkデータフレームに変換するエラー
- 15. pandasデータフレーム列をnp.datetime64に変換
- 16. JSON列をPandasデータフレームに高速変換
- 17. カテゴリに基づいて、pandasデータフレームの行を列に変換する方法は?
- 18. pandasデータフレームからLabeledPoint RDDに変換
- 19. pythonイテレータの出力をpandasデータフレームに変換する最も速い方法
- 20. pandasデータフレーム列を数値に変換するより良い方法
- 21. 4dリストをpandasデータフレームに変換する最適化された方法
- 22. R:データフレームをテーブルに変換する
- 23. パンダ:dbfテーブルをデータフレームに変換する
- 24. データフレームのpandasインデックスを列に変換するには?
- 25. モデルオブジェクトのリストをpandasデータフレームに変換するには?
- 26. バイトデータをpython pandasデータフレームに変換するには?
- 27. pandasデータフレームをブートストラップ用のMorrisデータセットに変換するには
- 28. 任意のハッシュをhtmlテーブルに変換する方法
- 29. 動的JSONをHTMLテーブルに変換する方法
- 30. HTMLテーブルにCSVファイルを変換する方法
をリリースread_htmlユーティリティは – root
はまた、html' 'への変換のように、非可逆である...私はないと思うが、それは' lxml'から少し助けを借りて、あまりにも難しいことではありませんタイプ情報が失われているので、自分で指定する必要があります。とにかく 'df'が比較的シンプルな場合(例えば統一データ型の場合)、変換はほんの数行のコードで済むはずです。 – root
パンダには、この問題を緩和しようとするタイプ推論メソッドがあり、かなり良い仕事をしています。 –