2018-04-08 11:45

Numpy、Pandas语法小记

设置

pd.set_option('display.mpl_style', 'default') # Make the graphs a bit prettier
#option display.mpl_style providing a sleeker visual style for plots, based on [GH3075][1] 
pd.set_option('display.line_width', 5000) 
pd.set_option('display.max_columns', 60) 

DataFrame

df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=['A','B','C','D'])
df = pd.read_csv(path_train, encoding="utf-8", header=0)
df.to_csv(path,columns=['Pred'], index=True, header=True)
df.info()#类型
df.describe()#统计

时间转换

data['TIME'] = pd.to_datetime(data['TIME'], unit='s') #将Unix毫秒数据转为datetime格式
data['TIME'].astype('<M8[ns]') #转换列类型
data['HOUR'] = [i.hour for i in data["TIME"]] #从datetime中取小时

重命名列名

df.index.name = 'Id' #重命名索引列
df.columns = ['Id', 'Pred'] #重命名所有列
df.rename(columns={'Y':'Pred'}, inplace = True) #重命名指定列

选取DataFrame信息

#取列
df['A']#得到Series类型
df[['A','B']]#得到DataFrame类型
#取行
df.loc[100],df.ix[100]  #按index值取Series
df.iloc[0]          #按位置选Series
df.loc[[100,101,102]],df.loc[100:103]
df.iloc[[0,1,2]],df.iloc[0:3]
#取值
df.loc[100]['A'],df.loc[100,'A']#float64
df.loc[100,['A']],df.ix[100:102,['A','B']]#Series/DataFrame
df.iloc[0]['A']#取值
df.iloc[0:2][['A','B']]#取值

volica

原创文章,欢迎转载。转载请注明:转载自 我家Ai智障,谢谢!
原文链接:http://www.mclover.cn/blog/index.php/archives/64.html

你可能还喜欢...

添加新评论

icon_question.gificon_razz.gificon_sad.gificon_evil.gificon_exclaim.gificon_smile.gificon_redface.gificon_biggrin.gificon_surprised.gificon_eek.gificon_confused.gificon_cool.gificon_lol.gificon_mad.gificon_twisted.gificon_rolleyes.gificon_wink.gificon_idea.gificon_arrow.gificon_neutral.gificon_cry.gificon_mrgreen.gif

captcha
请输入验证码