2016-09-02 12 views
2

テンソルフローのオブジェクト検出PASCAL-VOC 2012 datasetを実行したいと思います。テンソルフローのPASCAL-VOC 2012トレーニングデータとラベルを入力する良い方法

私はトレーニングのためのtensorflowに入力オブジェクトのラベルと対応境界ボックスと画像全体をしたいです。

テンソルを読み込むためのデータファイルを書く良い方法はありますか?あるいは、元のXMLファイルをテンソルフローで読み取るだけですか?

ありがとうございました。ここで

は、画像の例である: enter image description here

答えて

0

TFはまだxmlファイルの一切サポートしていないようです。

  1. 自分でバッチを作成して、TFプレースホルダにフィードすることができます。 https://www.tensorflow.org/versions/r0.10/how_tos/reading_data/index.html#feeding

  2. 独自のファイル形式と独自のデコーダを作成できます。その後、ファイルを読んで、ファイルバイトをtf.decode_rawとして取得し、何でもしてください。あなたが複数のファイルを同時に読むことを望むなら、関連する質問:Tensorflow read images with labels

私は最初のオプションは実装が簡単だと思います。あなた自身に尋ねるべきで

0

最初の質問です:あなたはPASCAL-VOCをどうしたいタスクの種類:

  • classifcation
  • セグメンテーション(ラベルは1番号)(ラベルは全体のイメージがある - 3Dテンソル)
  • 検出/局在化(ラベル画像上のオブジェクトの数に等しい可変長4dimベクトルの集合である)最初のケースで

VOCは、すべてのデータセットに対して するfilelistを提供するので、私は 画像パスとラベルの両方が含まれている小さなファイルを生成する、(TensorFlowを使用せずに、「定期的な 方法」で)前処理XML注釈ファイルを示唆している

が、これは本当に簡単です。 。 これにはPython xml.etreeモジュールを使用できます。第3のケースで

(オブジェクト検出):

I CSV形式に各個々のXMLファイルを前処理示唆

- 各行は、バウンディングボックスのdimmensoions 6つのcolumsを、4ており、その設定した後名前等 休息場所TensorFlow slice_input_producerを使用して、ファイルのペア(image_name.jpegannotation_file.csv)を持つ典型的なファイル名のキューを作成します。

パスとラベルのある小さなファイルを作成したら、内容をTensorFlow slice_input_producerにプリロードして適切な入力キューを作成するだけです。

関連する問題