Pandasライブラリ

Pythonによるデータ解析を支援する機能を提供しているライブラリライブラリ『Pandas』についてまとめました。

実行環境

ホストOSWindows 10 21H1(19043.1889) 64bit
仮想化ソフトウェアVirtualBox 6.1.34 r150636 (Qt5.6.2)
ゲストOSUbuntu 22.04
Python3.10.4

事前準備

pandasライブラリをインストール

pip install pandas

======================================================================
Successfully installed numpy-1.23.2 pandas-1.4.4 python-dateutil-2.8.2

サンプル

データフレームの操作

データフレーム:行と列で構成される表形式のデータ群のことです。

データフレームをCSVファイルから取得

サンプルコードと同じフォルダにcsvファイルが格納しておきます。

.
├── input1.csv
└── python_sample_0039_2.py
# input1.csv

clm1, clm2, clm3
1, 2, 3
a, b, c
-1, -2, -3.4

基本統計量を出力

サンプルコードと同じフォルダにcsvファイルが格納しておきます。

.
├── ゲームのプレイデータ.csv
└── python_sample_0039_3.py
# ゲームのプレイデータ.csv

年齢,人数
10,52
11,38
12,7
13,94
14,48
15,49
16,7
17,89
18,52
19,79
20,87
21,73
22,2
23,67
24,26
25,13
26,92
27,91
28,90
29,65
30,39