2016-11-22 27 views
0

私はバイオのようなデータと、Googleのスプレッドシートを使って公開Instagramアカウントからの投稿の数が必要です。フォロワー数を抽出してフォローできます。手伝ってくれますか ?Googleスプレッドシートを使用してInstagramデータをスクラップしますか?

+0

Googleスプレッドシートで開くことができるcsvに図表データをエクスポートするサービスがあります。http://blog.picodash.com/post/152986320610/download-instagram-metadata-to-spreadsheet – krisrak

+0

ありがとうございます@クリスラクリアルタイムデータが必要です。 –

答えて

3

この式は本当に複雑に見えますが、本当にすべてです - あなたが望む部分を持っている "スクリプト"セクションからデータを取り込むimportxml式です...次にregexreplace/extractの束を使用します機能私が読みやすい形式にデータをクリーンアップ:

は、例えば、この公開ページを取る:私は配列リテラルを使用して終了

=iferror(arrayformula(regexreplace({arrayformula(regexextract(transpose(split(regexreplace(regexreplace(concatenate(IMPORTXML(Sheet2!A1,"//script")),"\n",""),"(^.*""ProfilePage"": \[{""user"": {""username"": "")(.*)(nodes.*)","$2"),", """,false)),"(^.*)"": .*")),arrayformula(regexextract(transpose(split(regexreplace(regexreplace(concatenate(IMPORTXML(Sheet2!A1,"//script")),"\n",""),"(^.*""ProfilePage"": \[{""user"": {""username"": "")(.*)(nodes.*)","$2"),", """,false)),"^.*"": (.*)"))},"[""}{]",""))) 

http://www.instagram.com/salesforce/

は、次にB1やC1でこれを入力してください私が効果的にできること値からフィールド名を分割し、明らかにあなたはしかし、あなたが本当にしたいフォーマットが、それは引っ張るフィールドを示し、ここで画像を確認できます。

enter image description here

をも信者、followed_by、およびメディアのことに注意してください:数あなたが言及したフィールドです(例:あなたのコメントに答えて - 他の2つの値を取得したい場合は、次のような単一のregexextract関数のいずれかで行うことができます。この:

あなたはこれらの正規表現が動作し、生のデータをインポートする使用している場合:

メディア数:

=REGEXEXTRACT(concatenate(IMPORTDATA(E1)),"""media: {""count"": (\d+)page_info: {") 

伝記:

あなたがIMPORTXML方法にこれらの作品を使用している場合:

:自動的に自分の隣接するセルにそれらを置く2つのキャプチャグループを作成するか、であるそれらを個別に行うことができます

=REGEXEXTRACT(A1,"biography"": ""(.*)"", "".*""media"": {""count"": (\d+), ""page_info""")

そして伝記のために:

=REGEXEXTRACT(A1,"biography"": ""(.*)"", "".*""media") 

メディア数:

=REGEXEXTRACT(A1,"media"": {""count"": (\d+), ""page_info""") 
+0

がaurielle-perlmann @どうもありがとうございます:) –

+0

私は "次" フェッチと "フォロワー" データ 1. followed_by 'code' = REGEXREPLACE(CONCATENATE(IMPORTDATA(B1))するためにあなたがより単純な計算式を使用し、」 ($ 2)) 2.次のようになります。 'code' = REGEXREPLACE(CONCATENATE(IMPORTDATA(B1))、 (^。*が続きます:{"" count "":}(\ d +)(}。*) "、" $ 2 ") 「メディア数」と「伝記」の同様の小さな公式を手伝ってもらえますか? –

+0

私はその物を含めるために私の答えを更新@MishalKP –

関連する問題