Pandas Groupby Durchschnitt

Durchschnitt” oder Mittelwert in der Mathematik wird bestimmt, indem alle gegebenen Werte addiert und durch die Gesamtzahl der Werte dividiert werden. Bei der Arbeit mit Gruppendaten von DataFrame in Python müssen wir manchmal den Mittelwert oder Durchschnitt bestimmter Spalten ermitteln. Der „df.groupby()Die Methode wird zusammen mit der Methode „bedeuten()”-Methode zur Bestimmung des Durchschnitts/Mittelwerts der angegebenen einzelnen oder mehreren DataFrame-Spalten für jede Gruppe.

Dieser Beitrag bietet ein umfassendes Tutorial zur Bestimmung des Mittelwerts/Durchschnitts der DataFrame-Gruppendaten.

Wie bestimme ich den Mittelwert/Durchschnitt nach Gruppe in Pandas DataFrame?

Der „gruppiere nach()„wird zusammen mit „ verwendetbedeuten()”-Methode, um die Daten basierend auf einzelnen und mehreren Spalten zu gruppieren und den Mittelwert/Durchschnitt der einzelnen oder mehrerer Spalten zu ermitteln.

Lassen Sie uns diese Methode anhand des folgenden Beispielcodes untersuchen:

Beispiel 1: Bestimmen Sie den Mittelwert einer Spaltengruppe anhand einer einzelnen DataFrame-Spalte

Lassen Sie uns den folgenden Code verwenden, um den Mittelwert einer Spalte zu bestimmen, die nach einer einzelnen Spalte gruppiert ist:

Pandas importieren
data1 = {‚Name‘: [‚Joseph‘, ‚Lily‘, ‚Anna‘, ‚Henry‘, ‚Joseph‘, ‚Anna‘],’Alter‘: [15, 23, 32, 18, 14, 32],’Höhe‘: [5.6, 6.2, 3.7, 6.1, 4.3, 5.3]}
df = pandas.DataFrame(data1)
print(df, ‚\n‘)
df1 = df.groupby([‚Name‘])[‚Age‘].bedeuten()
drucken(df1)

Hier in diesem Code:

    • Der „Pandas„Modul wird importiert.
    • Der „pd.DataFrame()Die Methode „nimmt die Wörterbuchdaten als Argument und erstellt den DataFrame.
    • Der „df.groupby()Die Methode wird verwendet, um die Daten basierend auf der einzelnen Spalte zu gruppieren.Name“.
    • Nach dem Gruppieren von Daten basierend auf einer einzelnen Spalte wird das „bedeuten()Die Methode wird verwendet, um den Mittelwert oder Durchschnitt einer anderen Spalte mit dem Namen „Alter“, basierend auf den Gruppendaten.

Ausgabe

Der „gemittelter Durchschnitt” der einzelnen Spalte basierend auf der DataFrame-Gruppe wurde berechnet.

Beispiel 2: Bestimmen Sie den Mittelwert einer Spaltengruppe anhand mehrerer DataFrame-Spalten

Sehen wir uns den folgenden Code an:

Pandas importieren
data1 = {‚Name‘: [‚Joseph‘, ‚Lily‘, ‚Anna‘, ‚Lily‘, ‚Joseph‘, ‚Anna‘],’Alter‘: [15, 32, 23, 18, 15, 23],’Höhe‘: [5.6, 6.2, 3.7, 6.1, 4.3, 5.3]}
df = pandas.DataFrame(data1)
print(df, ‚\n‘)
df1 = df.groupby([‚Name‘, ‚Age‘])[‚Height‘].bedeuten()
drucken(df1)

Im obigen Code:

    • Der „df.groupby()„Methode gruppiert Daten basierend auf mehreren Spalten“Name“ Und „Alter“.
    • Der „bedeuten()Die Methode wird zusammen mit der Methode „gruppiere nach()”-Methode zur Bestimmung des Mittelwerts oder Durchschnitts der einzelnen Spalte basierend auf den Gruppendaten.

Ausgabe

Der „gemittelter Durchschnitt” der mehreren Spalten basierend auf der DataFrame-Gruppe wurde berechnet.

Beispiel 3: Bestimmen Sie den Mittelwert einer Mehrfachspaltengruppe anhand einer einzelnen DataFrame-Spalte

Dieses Beispiel wird verwendet, um den Mittelwert mehrerer Spalten basierend auf den Gruppendaten zu ermitteln:

Pandas importieren
data1 = {‚Name‘: [‚Joseph‘, ‚Lily‘, ‚Anna‘, ‚Lily‘, ‚Joseph‘, ‚Anna‘],’Alter‘: [15, 32, 23, 18, 15, 23],’Höhe‘: [5.6, 6.2, 3.7, 6.1, 4.3, 5.3]}
df = pandas.DataFrame(data1)
print(df, ‚\n‘)
df1 = df.groupby([‚Name‘])[[‚Age‘,’Height‘]].bedeuten()
drucken(df1)

Im obigen Code:

    • Der „df.groupby()Die Methode wird zusammen mit der Methode „bedeuten()„Methode zur Bestimmung des Mittelwerts mehrerer Spalten“Alter“ Und „Höhe” basierend auf der Datengruppe nach einer einzelnen Spalte.

Ausgabe

Alternative Methode: Verwenden der Funktion „agg()“ zur Bestimmung des Mittelwerts/Durchschnitts von DataFrame-Gruppen

Der „agg()Die Funktion „kann auch verwendet werden, um den Mittelwert/Durchschnitt der Pandas DataFrame-Datengruppe nach einzelnen oder mehreren Spalten zu bestimmen. Wenden wir diese Methode im folgenden Beispiel an:

Pandas importieren
data1 = {‚Name‘: [‚Joseph‘, ‚Lily‘, ‚Anna‘, ‚Henry‘, ‚Joseph‘, ‚Anna‘],’Alter‘: [15, 23, 32, 18, 14, 32],’Höhe‘: [5.6, 6.2, 3.7, 6.1, 4.3, 5.3]}
df = pandas.DataFrame(data1)
print(df, ‚\n‘)
df1 = df.groupby([‚Name‘])[‚Age‘].agg(‚mean‘)
drucken(df1)

Im obigen Code:

    • Der „df.groupby()„gruppiert die Daten von DataFame basierend auf den mehreren Spalten mit dem Namen „Alter“ Und „Name“.
    • Der „agg()„Methode übernimmt das Attribut „bedeuten” als Argument und bestimmt den Mittelwert/Durchschnitt der angegebenen Spalte basierend auf den Gruppendaten.

Ausgabe

Der Mittelwert/Durchschnitt wurde erfolgreich ermittelt.

Abschluss

In Python ist das „gruppiere nach()Die Methode wird zusammen mit der Methode „bedeuten()”-Methode zur Bestimmung des Mittelwerts/Durchschnitts einzelner oder mehrerer Spalten für die einzelnen Gruppendaten. Der „bedeuten()Die Methode wird verwendet, um den Durchschnitt einzelner oder mehrerer Spalten basierend auf den Gruppendaten von DataFrame zu bestimmen. Der „agg()Die Methode kann auch als Alternative zur Bestimmung des Mittelwerts/Durchschnitts für jede Gruppe verwendet werden. In diesem Artikel wurde anhand zahlreicher Beispiele eine ausführliche Anleitung zum Ermitteln des Mittelwerts/Durchschnitts für die einzelnen Gruppendaten vorgestellt.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen