openrefine

    0

    1答えて

    OpenRefine 2.6でvalue.matchコマンドを使用して、4つの日付に基づいて2つの列を分割しようとしています。 テキストのサンプルがある:私は「この列に基づいて列を追加します」としているん何 「最初の文第2文、第三の文章、2009年」 と value.match(\ dは{4})を挿入 私はエラーでエラーを解析 を得るには、12をオフセット:欠落数、文字列、識別子、正規表現、 また

    0

    1答えて

    OpenRefineバージョン2.6-rc.2で新しいプロジェクトを作成し、3185行のcsvファイルをロードしています。ファイルは小さいです(342 KB)。私が3155レコードで終わることを除いて、すべてがうまくいくように見えます(エラーまたは不正な列はありません)。ロード中に30レコードが消えました。何か案は? ありがとうございました。 Ivan

    0

    2答えて

    OpenRefineでセル内の特定の単語( "am")の後にあるものすべてを削除したいと思います。 マイデータ: ワークショップイムラーメンデWeiterbildungsprogramms午前02. 2015年11月 ストーミングが ブレーメンで09. 2015年11月午前ワークショップ午前17 2015年11月 "Auswählenウントbewerten"ハンブルクで 正規表現の例:[\n\r]

    0

    1答えて

    自動的に列に番号を付けたいと思います。 Excelと同様に、1つのセルに「1」と入力すると、そのセルの下に自動的に2,3,4,5などの番号が付けられます。なぜこの機能を理解するのが大変なのかわかりませんOpenrefineしかしどんな助けも大いに感謝されるでしょう。 おかげで、 ゲイル

    0

    1答えて

    私はOpenRefine(https://github.com/OpenRefine/refine-client-py)のPythonクライアントのドキュメントを読んできましたが、 "David Huynh's Refine tutorial"のリンクが壊れているようです。 私のPythonコードでは、私のマシンにローカルに保存されたCSVファイルをインポートして、Webページ(http://12

    0

    2答えて

    だから、私はクリーニングが必要な.csvファイルをたくさん持っています。彼らはすべて同じ手順を経なければならないので、OpenRefineの操作履歴を抽出して他のものに適用しました。 OpenRefineで各ファイルを1つずつ開いて、抽出したJSON履歴を適用することができました。しかし、多くのファイルがあります... また、私はOpenRefineでそれらを一度に開くための十分なメモリがありませ

    1

    1答えて

    次の式を使用して、行内のすべての値を連結したmd5ハッシュを返します。 md5(forEach(row.columnNames,cn,if(isNull(cells[cn]),"",cells[cn].value)).join("|")) これは、重複を識別するための簡単なインデックスを作成するためです(この段階では削除したくありません)。しかし、私は、列の1つにデータセットのユニークなインデ

    3

    1答えて

    多値。多値化されたセルの内容を取得しようとすると、動作させることができません。 7. {"resource":"abc"} Error: First argument to forEach is not an array 8. [{"resource":"def"},{"resource":"ghi"}] Error: Object does not have any field, includ

    0

    1答えて

    私は、列1(文字列はスペースで区切られた例:United Nations)の組織のリストを持っていて、関連するURL(www.un.org/など)列1は検索文字列としての値です。ジオコーディング手順はかなり簡単です(http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial#Geocoding_names_and_addresses)ので、Google検