2011-07-13 16 views
4

ビデオ録画内の特定のオーディオパターンを認識するために、Pythonで利用できるビデオ/オーディオライブラリはどれですか?
私はビデオファイル(特定の音声パターンまでスキップ)から記録の始まりを除外しようとしているので、私はその最初 Pythonのビデオおよびオーディオ処理ライブラリ

  • からファイルをスキャン

    • への道を必要とするだろうオーディオパターン(特定の曲は常に同じ)を認識する
    • 残りの録画はその時点から録音/コピーする。

    ビデオの詳細

    フォーマット: - リアルタイムメディア

    長(私はもっと何かに変換することができますよういえない事項は): - メディアを実行している24分

    から18から変わりますそのようなビデオの情報ツールは、次の詳細

    Video 
    ID        : 1 
    Format       : RealVideo 4 
    Codec ID       : RV40 
    Codec ID/Info     : Based on AVC (H.264), Real Player 9 
    Duration       : 19mn 18s 
    Bit rate       : 195 Kbps 
    Width       : 332 pixels 
    Height       : 248 pixels 
    Display aspect ratio    : 4:3 
    Frame rate      : 23.976 fps 
    Bits/(Pixel*Frame)    : 0.099 
    Stream size      : 27.0 MiB (84%) 
    
    Audio 
    ID        : 0 
    Format       : Cooker 
    Codec ID       : cook 
    Codec ID/Info     : Based on G.722.1, Real Player 6 
    Duration       : 19mn 20s 
    Bit rate       : 32.0 Kbps 
    Channel(s)      : 2 channels 
    Sampling rate     : 44.1 KHz 
    Bit depth      : 16 bits 
    Stream size      : 4.43 MiB (14%) 
    

    になります

    オリジナルの質問:

    先日私はアニメーションのシリアルドラゴンボールzを再訪し、私が持っていたビデオに苛立つ。各エピソードは約24分で構成され、それぞれには前のものの完全な要約と約6-8分​​の終了音楽の合計が含まれています。

    リキャップが完了し、ビデオの新しい名前が来たときに、各ビデオが同じオーディオを持っていることに気付きました。このオーディオを別々のファイルに記録しました。

    私はコーディングすることにより、以下の操作を行うことができますpythonでどのような方法があるかどうか尋ねてみたかった

    :=

    1. 実際の正確な時間を知るためにタイトル名の録音されたオーディオを一致させるためにオーディオをスキャンビデオ開始。

    2. 動画はその時点から保存してください。

    私はこれを行うことの難しさを知らないので、可能かどうかを教えてください。

    どのライブラリに私にツールを提供するのかを教えてもらえればいいと思います。どうすればいいのかというヒントを教えてください。

    どうもありがとう

  • +0

    私の質問の編集。私はこの質問が「本当の質問ではない」と投票したので、助けようとしています。それはおそらくあまりにも漠然としたと広く認識されていた。私は、SOにふさわしい質問として再読み込み/改訂を試みました。それは広範であるが、おそらく有用/興味深い。一言で言えば、指示どおりにビデオを処理しようとしている人にとって有用なポインタ(ライブラリ名、アルゴリズム、問題点など)は何ですか? – mjv

    +0

    user506710、「マーカー音楽」のビデオフォーマット、長さ、特徴などを指定することで、質問をさらに改善できますか? – mjv

    +0

    問題はありません:)私はそれが誰かがもっとはっきりと理解すれば助けてくれると思っています:)私はそれが広いと呼ばれる理由によって謎に包まれています...私は時間を取得した後、私はその時点からビデオをカットすることができます.... –

    答えて

    3

    私の知る限り、(また、2つのサウンド間の相似を得点として低レベルの機能を公開)の音声認識はPythonのthrough windows librariesまたはdragon naturally speaking APIでサポートされています。

    マーカーが見つかったら、thisまたはthisのような外部ライブラリを使用して、要件に従ってビデオをカットすることができます。

    EDIT:pyofaラッパー約musicip-libofaacousting fingerprintライブラリも返されました。

    関連する問題