2017-07-14 28 views
0

TensorFlowを使用して、適切なTFRコードであるXML文字列を処理したいと考えています。私はそれぞれのTFRecordを解析するコードをどのように構造化するのかを理解するのが好きです。出力TFRecordを生成するために、各TFRecordレコードに適用される一連の入力規則とデータ型のマッピングがあります。処理TensorFlow XML(テキスト)

例入力TFRecord:

<PLANT><COMMON>Shooting Star</COMMON><BOTANICAL>Dodecatheon</BOTANICAL><ZONE>Annual</ZONE><LIGHT>Mostly Shady</LIGHT><PRICE>$8.60</PRICE><EXTREF><REF1><ID>608</ID><TYPE>LOOKUP</TYPE><REF2><ID>703</ID><TYPE>STD</TYPE></EXTREF><AVAILABILITY>051399</AVAILABILITY></PLANT> 

のルールが解析され、それがどのようにフォーマットする必要がありますする必要があるかを示します。例えば。 EXTREF> REF2> IDとAVAILABILITY要素を見つけ、その値をTFRecordとしてエクスポートします。

出力例TFRecord:それは実行時に

Shooting Star,8.60,703,51399 

は、私がグラフにこのロジックを追加するにはどうすればよいので、出力TFRecordを生成?私の最初の考えは、マッピングロジックを一連のtf.opsに変換する必要があるということです。

答えて

1

このlinkは非常に役に立ちます。 TFRecordが必要とする正確な形式を指定し、独自のデータセットをTFRecordファイルに変換するコードを提供します。

しかし、そのリンクにはXMLというファイルは言及されていませんでした。 tf_exampleを作成してTFRecordにする方法についてのみ説明しました。このlinkは実際には一歩前に戻り、XMLファイルをtf_exampleに変える方法を示します。 Oxford Pet Datasetを使用しているため、ニーズに合わせて変更する必要があります。