2016-08-28 8 views
-4

学習ポータルに記載されているコースの統計を取得しようとしています。一つは、三つの要因の下に基づいて、4つの最も人気のあるコースを取得するには、次のとおりです。コースの加入者の最も人気の高いコースを計算するアルゴリズム

  • 私がされている

レビューの平均評価

  • 数ソリューションをいろいろ試してみましょう。しかし、上記を達成するための最良の方法を考え出すことはできません。

    一般的なコースで最も正確なデータを得るためにこれらの要素をどのように使用することができますか?

    ご協力いただきまして誠にありがとうございます。

    おかげ

  • +0

    あなたのアプローチを教えてください。 – jbsu32

    +1

    それは正しい方法が何であるかという意見の問題です。たとえば、1000人の加入者と平均レーティング4/5および20のレッスンのコースです。それは、900人の加入者、5/5人のavであるよりも良いか悪いですか?評価と5件のレビュー絶対に間違った答えはありません。 –

    +0

    @PaulHankin私はちょうど意見の問題を理解していますが、コースラ、udemyなどのポータルの学習は、これらの要因に基づいて人気のあるコースをどのように表示するのか理解したかったのですか? – user3400887

    答えて

    0

    あなたはこの式を試すことができます - ここ>

    popularity = 50*((NumSub/maxNumSub) + (RateAvg/RateMax)*(NumReview/NumSub)) 
    

    NumSub = Number of Subscribers in the Course. 
    maxNumSub = Maximum Number of Subscribers in all the Courses. 
    RateAvg = Average Rating of the Course. 
    RateMax = The Highest rating a course can get. 
    NumReview = Number of reviews of the course. 
    

    は、このようにあなたが 100の外に popularityの値を取得します。

    e.g: 
    

    このように、コースの人気値が53.5である私たちは、公式によると、そう、もちろんのために、

    popularity = 50 * ((80/100) + (4.5/5)*(24/80)) 
          = 50 * (0.8 + 0.9*0.3) 
          = 53.5 
    

    NumSub = 80 
    maxNumSub = 100 
    RateAvg = 4.5 
    RateMax = 5 
    NumReview = 24 
    

    を想定してみましょう。

    0

    これは私がそれを行うだろうかです:

    1. 3つの別々のリスト
    2. プット加入者、評価とレビューは、リスト内の最大値を見つけるためにmax()のような関数を使用し、その後からその値を削除しますリスト、(あなたがしたい場合)は、この4回、毎回新しいリストに最大の価値を追加する
    3. は、使用しているどのような言語また、各リスト

    のためにこれをしますか?私はこれが私のために働くだろう知っているが、それはあなたにそれについてのいくつかの主観的な式を与える前に、言語

    1

    によって若干異なる場合があり、私はbayesian statistics程度のリンクのカップルにあなたを指摘したいのですが、どのようにIMDb rates films

    単一のパラメータセットに対する重みをどのように選択するかは、ユースケースでは非常に主観的なようです。あなたはあまりにも多くのパラメータを持っておらず、どちらでも再生できません。たとえば、あなたはレビューの数を得ました...しかし、これはすべてが良いレビューであることを意味しますか?

    +0

    No.口コミの数で全てのクチコミを読むことを意味しました。 – user3400887

    関連する問題