2016-10-14 12 views
0

IMPORTXML 1つのセルに文字列としてページ上にあるすべてのテキストを取得しようとしています。本文にある文字列を1つのセルに文字列として入力する

たとえば、次のように開くと、websiteボディータグ内にあるすべてを取得したいと考えています。

私は次のことを試してみました:=transpose(IMPORTXML(A3,"/html/body/text()"))

あなたは5つのURLで私の例のスプレッドシートを見ることができます:

https://docs.google.com/spreadsheets/d/1LblNn8mGjSr5Tn5R5yZibXXq2w7DaHxDqKwmaD66cAQ/edit?usp=sharing

私の問題は、私は戻って任意の結果を得ることはありませんということです。

私が間違っていることは何ですか?

答えて

1

あり、これを行うために3本当に簡単な方法は、(技術的にはより多くの私たちは文句を言わない夢中に)ある、バリエーションの唯一の違いは、彼らが最後にフォーマットされている方法です:

1 - あなたは完全な書式設定を保持したい場合、または同様の行は、あなたがJOINで機能ラップし、ハードリターンまたは改行の等価である、あなたの区切り文字としてCHAR(10)を使用することができます破るあります

=join(char(10),IMPORTXML(A3,"//body")) 

enter image description here

2 - あなたは同じ機能を実行するだけの代わりに、完全な新しい行のスペースで参加することができます:

3-又は目標が実際にあるかの

=join(" ",IMPORTXML(A3,"//body")) 

enter image description here余分な空白と改行をなくしてデータを保存するには、連結と改行の両方を使用して既存の新しい行を置き換えることができます:

=REGEXREPLACE(CONCATENATE(IMPORTXML(A3,"//body")),"\n","") 

enter image description here

1

これは動作するようです:

=ArrayFormula(CONCATENATE(IMPORThtml(A3,"table",2) & CHAR(10))) 
関連する問題