2017-10-18 14 views
-3

私は構造化されていないデータ(アプリケーションのスクリーンショット)と半構造化されたデータ(スクリーンダンプファイル)を持っています。私の目標は、アプリケーション上の不具合や問題(意味のあるデータ)を見つけることです。さて、私はこれらのデータマイニングを適用したい、それはテキストマイニングの一種ですか?このデータに技術的なデータマイニングを適用するにはどうすればよいですか?非構造化データを使用したデータマイニングの実装方法

+0

スクリーンショットはイメージになり、スクリーンダンプはテキストデータになります。あれは正しいですか? –

+0

はい、画面ダンプはxmlデータです。これは画面のハイアリアキです – KaKa

答えて

0
  • まず、ルールベースのアプローチを使用して、欠陥シナリオを検出するルールセットを定義します。
  • 次に、欠陥、非欠陥シナリオの多くのインスタンスを持つトレーニングデータセットを準備することができます。このステップでは、収集するスクリーンショットまたはスクリーンダンプファイルごとに、それを手動で欠陥または非欠陥としてタグ付けします。
  • 次に、このトレーニングデータを使用してクラシファイアをトレーニングすることができます。クラシファイアはトレーニングサンプルを一般化して過去に見られなかったサンプルの出力ラベルを予測しようとする。
  • 入力が標準でないため、入力を標準形式に変換するためにいくつかの前処理が必要な場合があります。たとえば、スクリーンショットを処理するには、画像処理、OCR、コンピュータビジョンライブラリが必要な場合があります。
+0

Yogi Devendraありがとう – KaKa

関連する問題