異なる国の特定の単語の特定のバリエーションを説明する一連の基本的なhtmlテーブルを、データベースで使用するための作業用スプレッドシートに変換するスクリプトを作成しようとしています。各表は、各国の単一の単語の翻訳に適用されます。テーブルはテーブルからスプレッドシートにデータを書き込むための正規表現スクリプト
</table>
を終了するまで、このフォーマットが継続..................
<h5><a name="akas"> equivalent names in different countries </a> </h5>
<table border="0" cellpadding="2">
<tr>
<td>character string </td>
<td> country name/country name/country name</td>
</tr>
<tr>
<td>character string </td>
<td>country name</td>
</tr>
:HTMLでは、の形式をとります
各国の名前はテーブル間で繰り返されており、スプレッドシート上の列見出しを表し、その見出しには同等の語の行があります。私は完全に正規表現(私は実際に取得するには困惑している)とJavascriptでも初心者に新しいです。繰り返しますが、このタイプのデータをより大きなデータベースで使用するための作業用スプレッドシートに再編成する方法のヘルプが必要です。誰かが私を助けることができれば、本当に感謝します。
何が質問ですか? – Kashyap
質問は、上記の例のように複数の国がある場合でも、の間で国名を認識するようにするにはどうすればいいですか? td(テキスト文字列)の先の内容を列の下の正しいセル対応する国の – user1309067
これでデータを抽出し、CSVファイルを作成するsedスクリプトを書くことができます。 – Kashyap