私はフィードアグリゲータを書いていますが、それを少しでも最適化しようとしています。以前はsimplepie(PHPクラス)を使ってフィードを解析していましたが、各フィード項目にget_id()関数を使用してハッシュ(リンク+タイトルのmd5の組み合わせ)を返しました。私はこの「id」をMySQLの「remote_id」として保存します。しかし、私は重複がないことを確認するために、 "remote_id"が存在しないことを確認するために、各フィード項目に対してSELECTクエリを実行しています。これは私が1000のフィードを見ていると考えると非効率的です。MySQLの重複したエントリをスキップするためのベストプラクティス
remote_idを一意のキーに変更し、データベースが各パスで新しいレコードを書き込めないようにするのが最も効率的ですか?これをエンジニアリングする他の方法はそれが良いですか?
おかげで – phirschybar