私はPHPを初めて使用しています。xmlファイルがあり、PHPを使用してxmlファイル内の文を抽出して、文章を毎回3語に分解したいと考えています。文章は分割されます。
以下のXMLはXMLファイルのものです。
PHPを使用したXMLの中断文
<?xml version="1.0" encoding="utf-8" ?>
<document>
<content>
<segment>
<sentence>
<word>Hi</word>
<word>there</word>
<word>people</word>
<word>I</word>
<word>want</word>
<word>to</word>
<word>introduce</word>
<word>you</word>
<word>to</word>
<word>my</word>
<word>world</word>
</sentence>
<sentence>
<word>Hi</word>
<word>there</word>
<word>people</word>
<word>I</word>
<word>want</word>
<word>to</word>
<word>introduce</word>
<word>you</word>
<word>to</word>
<word>my</word>
<word>world</word>
</sentence>
</segment>
</content>
</document>
出力は次のようになります。
Hi there people
I want to
introduce you to
my world
Hi there people
I want to
introduce you to
my world
私は、XML trannscriptを処理する関数を作成しました。
function loadTranscript($xml) {
$getfile = file_get_contents($xml);
$arr = simplexml_load_string($getfile);
foreach ($arr->content->segment->sentence as $sent) {
$count = str_word_count($sent,1);
$a=array_chunk($count,3);
foreach ($a as $a){
echo implode(' ',$a);
echo PHP_EOL;
}
}
}
出力を生成できませんでした。 $sent
は配列と見なされますか?私はXMLレベルで文章を壊したい。
'$ GETFILE =のfile_get_contents($転写産物);' <それは実際に(afaict何もしていませんおそらく未設定の可変警告を生成することは別として)? – CD001
私はXPathを見てみることをお勧めします - それはXML文書をナビゲートするためのきれいな方法です:http://www.w3schools.com/xml/xpath_syntax.aspそして、SimpleXMLとDOMDocumentの両方で使うことができます。 – CD001