#-*- coding:utf-8 -*-import numpy as np;data1=[1,2,3,4,5]array1=np.array(data1)#创建数组/矩阵# 使用numpy中的array函数data2=[[1,3,4],[2,5,6]]array2=np.array(data2)#查看变量的数据类型:dtypearray2.dtype#转换数据格式 astypearray2_str=array2.astype('str')array2_str.dtype## pandas 有两个数据结构:Series和 DataFrame## Series类似一维数组,和array很像,由一组数据和数据标签(类似索引)组成## Series 能自动对齐索引,如果对不上,会NaN表示缺失import pandas as pd;s=pd.Series([1,2,3,4]);s1=pd.Series([1,2,3,4],index=['a','b','c','d'])s.indexs[1]s[[1,2]]#字典d={'qiulu':'handsome', 'lulu':'graceful' }s2=pd.Series(d)## DataFrame是一个表格型的数据结构,类似一张excel表格或者SQL##最常用的构建DataFrame的方法是:传入一个字典dict={ 'name':['张三','李四','王五','赵六'], 'sex':['男','男','男','女'], 'age':[18,19,20,21]}df=pd.DataFrame(dict)df.info() ## 查看数据类型df.age.astype('str')df['age']df['age']=[19,20,21,22]df['country']='china'# DataFrame查询会特别方便df[df.age==20]df[(df.age>=20) & (df.sex=='男')]# query 可以类似SQL的查询方式df.query('(age>18 and sex=="男") or (age<21 and sex=="女")')df1=pd.DataFrame(np.arange(4).reshape(2,2),columns=['a','b'])df2=pd.DataFrame(np.arange(12).reshape(2,6),columns=['a','b','c','d','e','f'])## iloc 序号## loc 标签## ix 行+列,序号标签都行
posted on 2017-08-16 12:59 阅读( ...) 评论( ...)