2016-12-12 4 views
4

私はTensorFlowでtf.image.decode_pngのようなイメージデコーダを見たことがありますが、オーディオファイル(WAV、Ogg、MP3など)の読み方はどうですか? TFRecordなしで可能ですか?TensorFlowグラフでOggやMP3オーディオファイルを読むには?

など。 thisのようなもの:

filename_queue = tf.train.string_input_producer(['my-audio.ogg']) 
reader = tf.WholeFileReader() 
key, value = reader.read(filename_queue) 
my_audio = tf.audio.decode_ogg(value) 

答えて

2

はい、パッケージtensorflow.contrib.ffmpegに、特殊なデコーダがあります。それを使用するには、まずffmpegをインストールする必要があります。

例:

audio_binary = tf.read_file('song.mp3') 
waveform = tf.contrib.ffmpeg.decode_audio(audio_binary, file_format='mp3', samples_per_second=44100) 
+0

ナイス!ありがとうございました! –

関連する問題