TensorFlowグラフでOggやMP3オーディオファイルを読むには？

私はTensorFlowでtf.image.decode_pngのようなイメージデコーダを見たことがありますが、オーディオファイル（WAV、Ogg、MP3など）の読み方はどうですか？ TFRecordなしで可能ですか？TensorFlowグラフでOggやMP3オーディオファイルを読むには？

など。 thisのようなもの：

filename_queue = tf.train.string_input_producer(['my-audio.ogg']) 
reader = tf.WholeFileReader() 
key, value = reader.read(filename_queue) 
my_audio = tf.audio.decode_ogg(value)

出典

2016-12-12 Carl Thomé

はい、パッケージtensorflow.contrib.ffmpegに、特殊なデコーダがあります。それを使用するには、まずffmpegをインストールする必要があります。

例：

audio_binary = tf.read_file('song.mp3') 
waveform = tf.contrib.ffmpeg.decode_audio(audio_binary, file_format='mp3', samples_per_second=44100)

出典

2016-12-12 22:15:06 sygi

ナイス！ありがとうございました！ –

TensorFlowグラフでOggやMP3オーディオファイルを読むには？

答えて

関連する問題