2017-07-06 5 views
1

アクセントを考慮せずに異なるラベルを比較する方法がわかりません。SPARQLでの文字列照合時にアクセント付き文字を無視する方法

「イバニェスは」スペインのDBpediaの中にアクセントを持っているので、次のクエリは場所を返しませんが、それは私のデータソース内の異なるアクセントを持っています。

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> 
PREFIX geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> 

SELECT DISTINCT ?iri 

WHERE { 

    ?iri rdfs:label ?label . 
    ?label bif:contains "'Blasco Ibañez'" . 

    ?iri ?location ?city . 
    FILTER (?location = <http://dbpedia.org/ontology/location> || <http://dbpedia.org/ontology/wikiPageWikiLink>) . 
    ?city bif:contains "valencia" 

} LIMIT 100 

アクセントを考慮しない方法はありますか?

+1

[この文字列で検索してください](HTTPS :。//dbpedia.org/sparqlデフォルトグラフ-URI =のhttp%3A%2F%2Fdbpedia.org&クエリ= + DISTINCT +%の3Firi%の0Dの%0AWHERE + {%0Dの%の0A ++%3Firi +のrdfs%3Alabel +%3Flabel +%の0Dを選択%0A ++%3Flabel ++ BIF%3Acontains ++ " 'ブラスコ+ Ibanezの'" +%の0Dの%の0Aの%の0Dの%の0A ++%3Firi +%3Flocation +%3Fcity +。%0D%0A ++ FILTER +(%3Flocation +%3D + + || ++ )+%0D%0A ++%3Fcity + bif%3A含有+ lencia "+} + limit + 100)。 [この記事](http://docs.openlinksw.com/virtuoso/virtuosotipsandtrickscontrolunicode3/)も参照してください。 –

+0

あなたの質問と私の質問は同じです。私は両方の違いを見つけることができません。とにかく、私が望む特定のDBpediaデータページはspannishバージョンにしかありません。http://es.dbpedia.org/sparql –

+0

dbpedia.orgでは、クエリが再帰しません。私のクエリは3つの結果を返します。 es.dbpedia.orgでは、[このクエリ](http://es.dbpedia.org/sparql?default-graph-uri=&query=SELECT+DISTINCT+%3Firi%0D%0A%0D%0AWHERE+ {%0D%0A %0D%0A ++%3Firi +のrdfs%3Alabel +%3Flabel +。%0D%0A ++%3Flabel ++ BIF%3Acontains ++ " 'ブラスコ+イバニェス'" +。の%0D%0Aのの%0D%0A ++%3Firi +%3Flocation +%3Fcity +。%の0D %0A ++ FILTER +(%3Flocation +%3D + + || ++ )+。%0D %0A ++%3Fcity + bif%3Acontains + "valencia" +%0D%0A} + limit + 100)は4つの結果を返します –

答えて

1

問題はcurrent configuration of the Spanish DBpedia endpointです。 (あなたは面白いthe query I used to check their configurationを見つけることがあります。)

彼らvirtuoso.ini含むように調整しなければならない -

[I18N] 
XAnyNormalization=3 

- コメントで引用されたようで、article about "normalization of UNICODE3 accented chars in free-text index and queries"に、さらなる議論documentation of the INI fileで説明した、とのように@ StanislavKralin。

(注 - これを書いている時点では、docにタイプミスがあります。 "WideFileNames = 1/2/3/0" に関するセクションでは、それは "XAnyNormalization = 1/2/3/0" についてだと言う必要があります)

関連する問題