0
非常に多くの場合、大きなdataset
のランダムサンプルを抽出する必要がありますか? openrefine
にはどのような方法がありますか?これは、R
とPython
でそれをやっていた実務家には役に立ちます。Openrefineでランダムサンプルを作成するには?
アドバイスを事前にいただきありがとうございます!
非常に多くの場合、大きなdataset
のランダムサンプルを抽出する必要がありますか? openrefine
にはどのような方法がありますか?これは、R
とPython
でそれをやっていた実務家には役に立ちます。Openrefineでランダムサンプルを作成するには?
アドバイスを事前にいただきありがとうございます!
Open Refineには組み込み関数がありませんが、Python/Jythonを使用して新しい整数列を作成することができます。例えば、あなたが100の000行を持っている場合:
row.index < 1000
EDIT:
import random
return random.randint(0, 100000)
をカスタムテキストファセットを有する第1千その後、あなたは、この列をソートすることができます恒久的に、行の順序を変更し、例えば選択私は@OwenStephensのthis extensionがrandomNumber GREL関数を追加したことを忘れてしまった。インストールしても構いません。
これは多くの役に立ちます。もう一度ありがとう!エトーレ! –
ようこそ。回答は途中で編集されました。注:OpenRefineに関する特定の質問がある場合は、専用の[Googleグループ](https://groups.google.com/forum/#!forum/openrefine)で質問することもできます。 –