私は同じことをjavaやc#で簡単にやりますが、シェルスクリプトでこれをやっているのはたくさんの学習です...大きなXMLをUNIXスクリプトを使って子ノードのチャンクに基づいて分割する
私はURLのような子ノードを持つ巨大なXMLノードを持っています(100Kノードと言うことができます)。そして、各サブファイルの10Kノードでinput.xmlを分割する必要があります。タブ)。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc> https://www.mywebsite.com/shopping </loc>
<changefreq> Weekly </changefreq>
<priority> 0.8 </priority>
<lastmod> 2016-09-22 </lastmod>
</url>
<url>
<loc> https://www.mywebsite.com/shopping </loc>
<changefreq> Weekly </changefreq>
<priority> 0.8 </priority>
<lastmod> 2016-09-22 </lastmod>
</url>
<url>
<loc> https://www.mywebsite.com/shopping </loc>
<changefreq> Weekly </changefreq>
<priority> 0.8 </priority>
<lastmod> 2016-09-22 </lastmod>
</url>
<url>
<loc> https://www.mywebsite.com/shopping </loc>
<changefreq> Weekly </changefreq>
<priority> 0.8 </priority>
<lastmod> 2016-09-22 </lastmod>
</url>
<url>
<loc> https://www.mywebsite.com/shopping </loc>
<changefreq> Weekly </changefreq>
<priority> 0.8 </priority>
<lastmod> 2016-09-22 </lastmod>
</url>
<url>
<loc> https://www.mywebsite.com/shopping </loc>
<changefreq> Weekly </changefreq>
<priority> 0.8 </priority>
<lastmod> 2016-09-22 </lastmod>
</url>
</urlset>
あなたはXMLパーサ、または単にいくつかの分割の魔法でこれをやりたいですか? – simbabque
シェルからjava/C++を呼び出すことができます。 – toolic
理想的には、Linux環境のデータステージジョブの後にこれを実行する必要があります。そうでなければ文字列と正規表現ではXMLパーサがうまくいくはずですが、エラーが発生しやすくなります。 – Ducati007