2017-09-05 7 views
0

非常に多くの場合、大きなdatasetのランダムサンプルを抽出する必要がありますか? openrefineにはどのような方法がありますか?これは、RPythonでそれをやっていた実務家には役に立ちます。Openrefineでランダムサンプルを作成するには?

アドバイスを事前にいただきありがとうございます!

答えて

2

Open Refineには組み込み関数がありませんが、Python/Jythonを使用して新しい整数列を作成することができます。例えば、あなたが100の000行を持っている場合:

row.index < 1000 

EDIT:

import random 
return random.randint(0, 100000) 

をカスタムテキストファセットを有する第1千その後、あなたは、この列をソートすることができます恒久的に、行の順序を変更し、例えば選択私は@OwenStephensのthis extensionがrandomNumber GREL関数を追加したことを忘れてしまった。インストールしても構いません。

enter image description here

+0

これは多くの役に立ちます。もう一度ありがとう!エトーレ! –

+0

ようこそ。回答は途中で編集されました。注:OpenRefineに関する特定の質問がある場合は、専用の[Googleグループ](https://groups.google.com/forum/#!forum/openrefine)で質問することもできます。 –

関連する問題