5.7.1. 常用¶
引入:
$ import pandas as pd
在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame:
1. Series类似于numpy中的一维数组,除了通常一维数组可用的函数或方法
而且其可通过索引标签的方式获取数据,还具有索引的自动对齐功能
2. DataFrame类似于numpy中的二维数组,同样可以通用numpy数组的函数和方法,而且还具有其他灵活应用
pandas.core.frame.DataFrame 查看:
df = pd.read_csv('../data/cuisines.csv')
type(df)
# 输出: pandas.core.frame.DataFrame
df.head()
df.info()
df.<param>.value_counts()
df.shape
df.T
df.sort_values(by='value', ascending=False, inplace=False)
# 类型
df.values # numpy.ndarray 类型
X_test.loc # pandas.core.indexing._LocIndexer
X_test.iloc # pandas.core.indexing._iLocIndexer
X_test.loc[0] # pandas.core.series.Series
参考¶
快速学习——Comparison with SQL: https://pandas.pydata.org/docs/getting_started/comparison/comparison_with_sql.html
API reference: https://pandas.pydata.org/docs/reference/index.html
User Guide: https://pandas.pydata.org/docs/user_guide/index.html
【Pandas 学习】Pandas 基础: https://tianchi.aliyun.com/notebook-ai/detail?postId=6068