2016-10-20 44 views
0

ペンタホから.vcf.gzファイルを読む必要があります。 「コンテンツ」タブの「テキストファイル入力」から「圧縮」を「GZ」に設定することができます。Pentahoヘッダーをスキップし、ファイル名を出力に追加

- 最初はすべてヘッダーをスキップする必要があります(基本的に#が始まる行はすべて)。

- すべての行にファイル名を挿入する新しい列を挿入する必要があります。

など。

私のファイルは、次のとおりです。

#header 
#header 
#header 
# chr pos ref alt 
    chr1 3 A A 

私が欲しいものです:

chr1 3 A A id_001 (Taken readeing file name) 

どのように私はこれを達成することができますか?

答えて

1

[コンテンツ]タブが見つかった場合は、[ヘッダー]チェックボックスが表示されている必要があります。スキップする行数を指定できます。ファイル名については

enter image description here

、「追加の出力フィールド」タブでは、何が必要です。

enter image description here

ここでは、出力のプレビューです:

enter image description here

ファイル名からファイル拡張子を削除する必要がある場合は、それを行うにはいくつかの方法があります。

+0

私は間違っている何かがあります。 私は必要なファイルを取得するためにファイルのパスを設定しました。 ヘッダーオプションを私の必要に応じて見せたように変更しました。 最後の列を追加しましたが、最後の列のみが表示されます。 "タブ"フィールドで何かを変更する必要がありますか? – xCloudx8

+0

ああ、いくつかのフィールドが必要です何かありますか? – CGritton

+0

大丈夫です、フィールドの問題を解決しました ファイル名私の名前は次のようなものです:001.genome.vcf.gz最初のものの後にすべてのものを削除したいのですが、001しかないので、他のオプションはありますか? – xCloudx8

関連する問題