2017-07-31 17 views
0

私は地理空間データ処理を扱うEmberアプリケーションを開発しています。このプロジェクトの一部は、データエントリに対応するフィールドを含むデータレイヤーを記述するJSONオブジェクトをインポートすることです。たとえば、 "Laundry Facilities"というデータレイヤーをインポートしているとします。 JSONは次のようになります。与えられたタイトルに基づいてオブジェクトのタイプを提案する

データインポートワークフローのある時点で、各フィールドにタイプを指定する必要があります。たとえば、「施設の名前」のタイプは文字列になり、「乾燥機の数」のタイプは整数になります。私はlabelまたはkey属性に基づいて、ユーザーにすべてのフィールドのタイプを指定するのではなく、推奨されるタイプを提供したいと考えています。データフィールドを記述するラベルのような定性的なものに基づいてデータ型を推測する機能を提供するアルゴリズム、パッケージ、フレームワークなどはありますか?それとも私はこれを実装できる別の方法を知っていますか?私は100%の精度を期待していないことを知っていますが、荒いタイプの推測でさえ非常に役に立ちます。それがEmberアドオンであればボーナスポイント。

答えて

0

あなたの最善の策は、単純なヒューリスティックを書くことです。種類に合わせて多くのキーワードをマッピングするよりもはるかに複雑ではありません。あなたが説明したように、 '数字'はおそらく数字型を意味し、 '名前'はおそらく '名前'型を意味します。

一般に、分類の問題について説明しています。これは、(おそらく)少数の訓練例では解決するのが難しいでしょう。ある程度の数の列名の例を得ることができるなら、まず、意思決定木やロジスティック回帰を試してみましょう。特定の単語がフィーチャとして存在し、出力変数としてデータ型が生成されます。

関連する問題