私は単語の文書(2003)を持っています。私はPowershellを使って文書の内容を解析しています。 文書には、一番上に数行のテキストがあり、列数が異なる12の表があり、さらにテキストがいくつか含まれています。テーブルなどで単語文書(* .doc)の内容を読む
私は以下のようなものとして文書を読むことができることを期待:
- 読取原稿(など、必要なオブジェクトを作る)
- テーブルの一部でない場合は、テキスト
- の各ラインを取得します。テーブル
- の一部は、(順序で)テーブル番号を取得し、COLに基づいて出力を解析する場合は、テキストなどのプロセスや他の
- をアウトプットに書きます
以下は、私が書くために始めているPowerShellスクリプトでumns
$objWord = New-Object -Com Word.Application
$objWord.Visible = $false
$objDocument = $objWord.Documents.Open($filename)
$paras = $objDocument.Paragraphs
foreach ($para in $paras)
{
Write-Output $para.Range.Text
}
は、段落は、私が欲しいものであるかどうかはわかりません。私の目的に適したものはありますか? 私が今得ているのは、文書の内容全体です。どのように私が得るものを制御するのですか?私は行を取得したいのと同じように、それがテーブルの一部であるかどうかを判断し、それが何番目のテーブルに基づいてアクションを取ることができるようにします。
Word文書は、行に編成されていません。解決策として認識しているものではなく、解決しようとしている問題について説明してください。 –
ありがとうございます - お返事ありがとうございました... 私は、このテキストにはテキストと約5〜6個の表が含まれています。各表には2〜6のさまざまな数の列があります。各表の最初の行にヘッダーが記載されています。 私が達成しようとしているのは、(Powershellを使用して)ドキュメントを読み込み、Oracleデータベースに対して個別に実行できるテーブルと出力SQL文の内容を解析することです。 私は多くのそのような文書を持っており、それぞれの構造は似ています。しかし、それぞれのテーブルには多かれ少なかれ行があるかもしれません。 – Anoop