2016-04-22 53 views
0

どういうわけか、日付の時点で壊れたdocumentation on Arelle's python APIがあったため、APIを動作させてXBRLファイルを正常に読み込むことができました。ArelleのPython APIを使用してXBRLファイルからのみ財務諸表を抽出する方法は?

とにかく、私の質問は:

私はXBRLファイルから文だけを抽出するにはどうすればよいですか?

以下は、ArelleのWindowsアプリケーションのスクリーンショットです。この例で使用

URL:私はここにAPIを使って実験してみましたhttps://www.sec.gov/Archives/edgar/data/101984/000010198416000062/ueic-20151231.xml

Arelle GUI

は私のコード

from arelle import Cntlr 

xbrl = Cntlr.Cntlr().modelManager.load('https://www.sec.gov/Archives/edgar/data/101984/000010198416000062/ueic-20151231.xml') 

for fact in xbrl.facts: 
    print(fact) 

だが、このスニペットを実行した後、私はこれらが殺到しています:

PyCharm CLI

私はmodelFactと利用可能な鍵をcontextRefiddecimalsunitRefの間に入れてみましたが、これは私が抽出したいものからは役に立たないものです。これをさらに手助けする文書はありませんが、私はここで紛失しています。誰かが声明だけを抽出する方法について私を啓発することはできますか?

答えて

0

私は似た何かをやっているし、これまでのところ、私は共有することができ、いくつかの進展があった:

はarelleのPythonコードのファイルを通って行くあなたは、このようなModelFact、ModelContextなど異なるクラスのためにアクセスできるプロパティを検出することができます以下のように、ModelUnitなど

個々のデータを抽出するには、例えばパンダのデータフレームでそれらを置くことができます:

factData=pd.DataFrame(data=[(fact.concept.qname, 
          fact.value, 
          fact.isNumeric, 
          fact.contextID, 
          fact.context.isStartEndPeriod, 
          fact.context.isInstantPeriod, 
          fact.context.isForeverPeriod, 
          fact.context.startDatetime, 
          fact.context.endDatetime, 
          fact.unitID) for fact in xbrl.facts]) 

を今では、すべてのデータで動作するように簡単です、あなたが望むものをフィルタリング使用するステートメントテーブルを再現したい場合は、それぞれの事実と順序とソートのためのリンクも組み込む必要がありますが、私はこれまでのところどちらも得ていません。

+0

このメソッドを使用するとさらに機能が向上しましたか? –

関連する問題