0
で
をバイグラムとトライグラムを生成します。私が使用thisスレッドを発見した検索した後私は一連のトークンから<em>nグラム</em>を生成生成したいKeras/Tensorflow
bigram:: "1 3 4 5" --> { (1,3), (3,4), (4,5) }
:
def find_ngrams(input_list, n):
return zip(*[input_list[i:] for i in range(n)])
私がトレーニング時間中にこのコードを使用すると、深いラーニングライブラリでパフォーマンスがのために死に至ると思います。だから、lambda
のようなものを探しています(前処理ステップですべてのシーケンスを生成することも可能ですが、それはエレガントな方法ではないと思います...)