Pythonで条件付きで2つのデータベースを一致

私は食品とレストランのオブジェクトのコレクションを持っており、私はすべてのオブジェクトの食品オブジェクトを対応するレストランに一致させる必要があります。時間複雑度O（n * m）を持つ素朴な解を実装しました。ここでnとmはそれぞれ食品データベースとレストランデータベースのサイズです。Pythonで条件付きで2つのデータベースを一致

def match_products(self): 
    self._restaurant_dict= self._init_restaurant_dict() 
    for food in foods(): 
     for restaurant in self._restaurant_dict.keys(): 
      if self._matched(restaurant , food): 
       self.mached_candidates[restaurant].append(food) 

def _init_restaurant_dict(self): 
    res_dict= {} 
    for product in restaurants(): 
     res_dict[restaurant] = [] 
    return res_dict 

def _matched(self, restaurant , food): 
    return restaurant.id == food.id

レストラン、食品は次のように定義されています。

class Structure: 
    _fields = [] 
    def __init__(self, *args): 
     if len(args) != len(self._fields): 
      raise TypeError("Wrong args number") 
     for name, val in zip(self._fields,args): 
      setattr(self, name, val) 

    def __repr__(self): 
     return ', '.join("%s: %s" % item for item in vars(self).items()) 

class Restaurant(Structure): 
    _fields = ["id","name","owner"] 

class Food(Structure): 
    _fields = ["id","descriptions","calories"]

メソッド食品（）やレストランが（）ジェネレータです。どうすればこのアルゴリズムを高速化できますか？

出典

2017-10-10 user1877600

'foods（）'と 'restaurants（）'は特定の順序で内容を出力しますか？多分 'id'を' Structure'に写像するディクショナリを使っているので、リストの1つを一度しか反復する必要はありません。 –

これは素晴らしいです！ありがとうございました。ソリューションは簡単でした。俺はバカです！ – user1877600

ルックアップテーブルのハッシュ値としてidを使用します。

lookup_table = dict() 
for food in foods(): 
    if food.id not in lookup_table: 
    lookup_table.update({food.id: [food]}) 
    else: 
    lookup_table[food.id].append(food) 
matched_candidates = {restaurant : lookup_table.get(resturant.id, []) for restaurant in restaurants()}

などです。 O（N + M）

出典

2017-10-10 16:04:17 VoNWooDSoN

ありがとうございます。もう一つ質問があります。同じアイデアと同じファーストネームのキャラクターのように、少し複雑な条件を使用して同様のマッチングを行う方法はありますか？ – user1877600

確かに、良いハッシュ値を作ることについて考えてみることをお勧めします。この作品を作るのは、食べ物のIDとレストランのIDの間に良い "1対多の"関係があるということです。あなたがそれを複雑にすれば、それほど速くないかもしれません。私はここで例を追加します。ここでは、名前の最初の文字をバケツにしますが、コードでこれらの関係を実行しようとするよりもデータベースが適切なときを考えます。 – VoNWooDSoN

わかりましたので、私はあなたがレストランIDと食品名の最初の文字で食品を選択できるようにしたいと考えています。だから、「パパハット」は42のIDを持ち、あなたは「ピザ」を望んでいたとします。鍵でそれを見ています42p これはなぜ機能しますか？ restaurant.idフィールドが一意の識別子であり、という文字列に連結された一意の文字列は、まだ一意であると予想されるので、は一意です。したがって、restaurant.idフィールドを複雑にすると、ルックアップテーブルの検索がより具体的になります。しかし、食べ物を入手するためにはより多くのアクセスが必要になります。このトレードオフを試すことができます。 Wiki on hash tables Advantages/Drawbacks

matched_candidates = dict() 
for food in foods(): 
    if food.id not in lookup_table: 
    matched_candidates .update({''.join(food.id, food.name[0].lower()): [food]}) 
    else: 
    matched_candidates [food.id].append(food) 

    matched_candidates.update({ restaurant : [] 
          for restaurant in restaurants() 
          if restaurant not in matched_candidates.keys() 
          })

アップデートは、（）ジェネレータ食品中の任意の食品を持っていない可能性がありresturantsのを追加することです。これはまだO（N + M）です。

私はここで正直である必要があります、これは私に間違って感じる。テーブルにアクセスできるようにするには、食べ物とレストランの両方の特別な知識が必要です。しかし、ルックアップは速いので、多分あなたが気にしているのです。

出典

2017-10-11 15:49:48 VoNWooDSoN

Pythonで条件付きで2つのデータベースを一致

答えて

関連する問題