前回は列データや行データを「追加」することをこちらで学びました。
今回は「条件に合うデータを抽出する」「データを集計する」ことを勉強していきましょう。
準備のため前回同様「pandas」というフォルダを作り、あらかじめ表データを作成しました。
解説
import pandas as pd | pandasライブラリをimportします。省略してpdとします。 |
df = pd.read_csv(“test.csv”) | pdから.read_csv(“ファイル名”)という命令をして読み込みます。それを変数dfに代入します。 |
print(“英語の最高点 =”, df[“英語”].max()) | 最大値はdf[“列名”].max()で命令。 |
print(“英語の最低点 =”, df[“英語”].min()) | 最低値はdf[“列名”].min()で命令。 |
print(“英語の平均値 =”,df[“英語”].mean()) | 平均値はdf[“列名”].mean()で命令。 |
print(“英語の中央値 =”, df[“英語”].median()) | 中央値はdf[“列名”].median()で命令。 |
print(“英語の合計 =”, df[“英語”].sum()) | 合計値はdf[“列名”].sum()で命令。 |
一瞬で計算して表示してくれました。
次はデータを並び替えてみましょう。
解説
import pandas as pd | pandasライブラリをimportします。省略してpdとします。 |
df = pd.read_csv(“test.csv”) | pdから.read_csv(“ファイル名”)という命令をして読み込みます。それを変数dfに代入します。 |
small = df.sort_values(“英語”) | 小さい順に並べ替えるには、df.sort_values(“列名”)で命令します。それを変数smallに代入します。 |
print(“英語の点数が低い順\n”, small) | バックスラッシュで改行し、表示します。 |
print(“\n”) | 改行します。 |
big = df.sort_values(“数学”, ascending=False) | 大きい順に並べ替えるには、df.sort_values(“列名”,ascending=False)と命令します。それを変数bigに代入してます。 |
print(“数学の点数が高いもの順/\n”, big) | バックスラッシュで改行し、表示します。 |
うまく命令通り並べ替えができました。
次は行と列を入れ替えてみましょう。
解説
import pandas as pd | pandasライブラリをimportします。省略してpdとします。 |
df = pd.read_csv(“test.csv”) | pdから.read_csv(“ファイル名”)という命令をして読み込みます。それを変数dfに代入します。 |
print(“行と列を入れ替える\n”,df.T) | 行と列を入れ替えるには、「.T」を付けます。 |
print(“\n”) | 改行します。 |
print(“リストデータ化\n”, df.values) | リストデータ化するには、「values」を付けます |
うまく列と行を入れ替えることができました。またリストデータを取り出すことができました。
*尚、ここではバージョン「Python 3.10.1」を使用しています。
この本から引用、参考に学び、完成させることができました。しかし、ここではプログラミング初心者の私が詳しく解説することは、おこがましく、難しく出来ません(ToT)
その点、この本では丁寧な解説が載っていますので、解説とともにコードを書き、完成させればより深く学ぶことができます(^.^)、実際、初心者の私でもわかりやすかったです。身に付け消えないスキルが2,000円程ならコスパよく、買っておいてよかったと満足してます。