数字の値を検証することも、すべての項目を読み取ることもできないことを考慮して、そのテキストデータを検証して検証する方法については疑問に思っています。テキストデータの検証とクリーニング
特定のケースでは、.mboxファイルから取得した電子メールのテキストデータを処理しています。ですから、すべての種類の書式があります。つまり、署名などです。分析したいテキストは基本的に本文のサブセクションです。私が好きなものを抽出する方法を見つけたら、私が作業するデータが私が特に必要としているものであることを検証するにはどうしたらいいですか?