NLP/Machine Learingを使用してテレビや映画ファイルにトークン/タグを付ける方法があるかどうかは分かりました。NLP /機械学習でTVと映画のファイル名を一致させるには?
すでにこれを行う多くの正規表現アプローチがあることは知っていますが、NLP /機械学習でもこれを行うことはできませんか?
例: The.Heart.Guy.S01E07.Die.Belastungsprobe.German.DL.720p.HDTV.x264-GDR
ようなものになるはずです。
The Heart Guy SHOW-NAME 1 SEASON 7 EPISODE Die Belastungsprobe EP-NAME German DL LANGUAGE 720p RESOLUTION HDTV SOURCE x264 CODEC GDR GROUP
誰もが今までこのような何かを試してみましたか?あるいは、どこから始めるべきか、あるいはこのようなことを得ることさえ可能であるというヒント。
カスタマイズされたアプローチは、1つの(エピソード名と共同でテレビデータベース)外部データを使用する可能性がある場合は特に、優れただろう。ここでは時間の無駄のようなMLの音を使用すると、何とかしていくつかの学習セットを準備する必要がありますが、これはやりにくいでしょう。 – sascha