2017-05-14 10 views
0

私はセレンを初めて使っています。私はテスト目的でいくつかのサイトを試しています。 タミールとヒンディー語のフォントが「??????」として廃止されているシナリオを考えてみましょう。英語以外のフォントを削ることができません - セレン

私はnotepad ++、sublimetext、excelで出力を開こうとしましたが、「??????」と表示されます。

Xpath tried - //h1//following::p[@id='topDescription'] 

Test URLs 
"https://www.hooq.tv/catalog/7a6d593d-e8f3-47b6-92ae-469b8e08178e?__sr=feed" 
"https://www.hooq.tv/catalog/d023630f-882b-4df4-8cb5-857ebfff20b4?__sr=feed" 

コード

d.get("https://www.hooq.tv/catalog/7a6d593d-e8f3-47b6-92ae-469b8e08178e?__sr=feed"); 
d.findElement(By.xpath("//h1//following::p[@id='topDescription']")).getText(); 

これは問題をコード化について何かですか?

+0

擦り傷のデータを、そのような種類のコンテンツをサポートするファイル形式に直接保存する方が良いでしょう。 – kushal

答えて

0

まず、外部ファイルに保存する前に生のテキストを正しく取得できることを確認します。

私はあなたの要素のJavaで.getText()をテストしましたが、そのままStringを返しています。

enter image description here 次に、ファイル書き込み時に、文字セットのエンコーディングがUTF-8であることを確認する必要があります。ここで

org.apache.commons.io.FileUtilsを使用したサンプルです:

FileUtils.write(new File("C:/temp/test.txt"), str, "UTF-8"); 
FileUtils.write(new File("C:/temp/test.csv"), str, "UTF-8"); 

enter image description here

はそれがお役に立てば幸いです。

関連する問題