0
LinuxシステムでFlexユーティリティを使用してHTMLテーブルコードをプレーンテキストに変換する必要があります。
私は次のようにしている私の.lexファイルのトークンのリストを作ってみた:
LexとYaccを使用してHTMLテーブルをプレーンテキストに変換する
OPENTABLE <table>
CLOSETABLE </table>
OPENROW <tr>
CLOSEROW </tr>
OPENHEADING <th>
CLOSEHEADING </th>
OPENDATA <td>
CLOSEDATA </td>
STRING [0-9a-zA-Z]*
%%
%%
HTMLの解析のための私のCGFは(翻訳スキームが含まれている)のようになります。
TABLE --> OPENTABLE ROWLIST CLOSETABLE ;
ROWLIST --> ROWLIST ROW |^ ;
ROW --> OPENROW DATALIST CLOSEROW printf("\n");
DATALIST --> DATALIST DATA |^ ;
DATA --> OPENDATA STRIN CLOSEDATA printf(yytext+"\t");
いくつかの例を見てきましたが、私の.lexファイルのルールセクションに何を書き込むべきかが分かりません。