Writerで書かれたバイリンガル辞書を更新する必要があります。LibreOffice Writerでフォントとフォントスタイルでドキュメントをトークン化/解析/検索して置き換える方法は?
- メインワード(太字1)
- 外国等価音訳(フォント1、イタリック)
- 外国の同等(太字2)音声の
- 部分(フォント1、イタリック)
文書の各行は、上記の部分の後ろにスペースまたは句読点で区切られたメインワードです。
ファイルごとに1行ずつ歩いていくプロセスを自動化し、スペースと句読点を無視して各パート間に区切り文字を配置する必要があります。そのため、Calcファイルに大量に読み込むことができます。言い換えれば、「各部分」は、同じフォントとフォントスタイルを持つ文字の並び(スペースと句読点を無視する)です。
標準検索を試しました&置換機能とAltSearch拡張機能はどちらも完了できません。
検索:同じフォントとFONT_STYLEと連続した文字は、スペースや句読点を無視
を交換してください:用語+上で見つかった「主な問題は、私が言う、検索クエリを記述することはできませんよです区切り文字 "
このためのスクリプトを書く方法や、既存のツールで問題を解決できるかどうかについてのご意見はありますか?
ありがとうございます!
所望の効果のための擬似コード:ここで
var delimiter = "|"
Go to beginning of document
While not end of document do:
var $currLine = get line from doc
var $currChar = get next character which is not space or punctuation;
var $font = currChar.font
var $font_style - currChar.font_style (e.g. bold, italic, normal)
While not end of line do:
$currChar = next character which is not space or punctuation;
if (currChar.font != $font || currChar.font_style != $font_style) { // font or style has changed
print $delimiter
$font = currChar.font
$font_style - currChar.font_style (e.g. bold, italic, normal)
}
end While
end While
.odtの解凍と.xmlファイルの取り出しは参考にしてください。私は.odtがzip形式であることに気づいていませんでした。 – kaanch