2017-09-22 19 views
0

私はこのようになりますいくつかのデータを分析するJupyterノートブックを作ってるんだ:Jupyterノート - Pythonのコード

The Data I'm analyzing

私は、この情報を見つけるために持っている:

The Questions

この私が試したことですが、それは動作していないと私はパートbを行う方法で完全な損失になっています。

# Import relevant packages/modules 
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
from scipy import stats 

# Import relevant csv data file 
data = pd.read_csv("C:/Users/Hanna/Desktop/Sheridan College/Statistics for Data Science/Assignment 1/MATH37198_Assignment1_Individual/IGN_game_ratings.csv") 

# Part a: Determine the z-score of "Super Mario Kart" and print out result 
superMarioKart_zscore = data[data['Game']=='Super Mario Kart'] ['Score'].stats.zscore() 
print("Z-score of Super Mario Kart: ", superMarioKart_zscore) 

# Part b: The top 20 (most common) platforms 

# Part c: The average score of all the Shooter games 
averageShooterScore = data[data['Group']=='Game']['Score'].mean() 
# Print output 
print("The average score of all the Shooter games is: ", averageShooterScore) 

# Part d: The top two platforms witht the most perfect scores (10) 

# Part e: The probability of a game randomly selected that is an RPG 
# First find the number of games in the list that is an RPG 
numOfRPGGames = 0 
for game in data['Game']: 
    if data['Genre'] == 'RPG': 
     numOfRPGGames += 1 
# Divide this by the total number of games to find the probablility of selecting one 
print("The probability of selecting a game that is an RPG is: ", numOFRPGGames/totalNumGames) 

# Part f: The probability of a game randomly selected with a score less than 5 
# First find the number of games in the list with a score less than 5 using a for loop: 
numScoresLessThan5 = 0 
for game in data['Game']: 
    if data['Score'] < 5: 
     numScoresLessThan5 += 1 
# Divide this by the total number of games to find the probablility of selecting one 
print("The probability of selecting a game with a score less than 5 is: ", numScoresLessThan5/totalNumGames) 
+2

あなたは、ダウン個別の質問にこの質問を壊したくてそうした方が良い答えを得られるでしょう。特定の質問にまだ集中していない場合は、[MCVE](https://stackoverflow.com/help/mcve)を見てください。何を試してみましたか、それがなぜ機能していないのか、出力を期待しているのですか?することが。 – johnchase

答えて

0

パンダは、この種の問題に対して優れた組み込み関数を持っています。ここでは、CSVからインポートしたテストデータを使用してパートbを解決するための提案を示します。私が使用したのtest.CSVだけで、これらのフィールドを持っているが、それでも、列名を変更し、

Sample CSV structure新しいファイルをインポートする、あなたのケースで動作します。

# Import relevant packages/modules 
import numpy as np 
import pandas as pd 

# Import a dummy csv data file 
data = pd.read_csv("./test.csv") 
# Visualize the file before the process 
print(data) 

# Extract the column you're interesting in counting 
initial_column = data['Name'] 

# Create object for receiving the output of the value_counts function 
count_object = pd.value_counts(initial_column) 

# Create an empty list for receiving the sorted values 
sorted_grouped_column = [] 

# You determine the number of items. In your exercise is 20. 
number_of_items = 3 
counter = 0 

for i in count_object.keys(): 
    if counter == number_of_items: 
     break 
    else: 
     sorted_grouped_column.append(i) 
     counter = counter + 1 

print(sorted_grouped_column) 
関連する問題