数据分析常用库基础知识

数据分析常用库基础知识

一、numpy

1、简介

NumPy(Numerical Python)是Python进行科学计算的一个扩展库,提供了大量的函数和操作,主要用于对多维数组执行计算,它比Python自身的嵌套列表结构要高效的多。

NumPy数组(class ndarray和 Python列表(list)的主要区别:

  1. 数组会对元素的数据类型做统一,而列表不会。

  2. 数组创建后具有固定大小,而列表由于内存自动管理,可动态调整。

2、创建数组

np.array(object, dtype=None)

  1. object:aray_like,类似于数组的对象。如果object是标量,则返回包含object的0维数组
  2. dtype:data-type,数据类型。如果没有给出(一般不给),会从输入数据推断数据类型创建一个数组对象并返回(ndarray实例对象)
import numpy as np num = 369 arr = np.array(num) print(num) print(arr) print(type(num)) print(type(arr)) print('-'*30) print("虽然同样输出369,但数据类型不同") print('='*30) lst=[9,5,6,8,0] arr = np.array(list) print(lst) print(arr) print('-'*30) print('判断几维数组的方法:几个括号就是几个,如:num是0维,lst是1维') print('='*30) print('数组与列表的相同点') print('1、求长度') print(len(num)) print(len(arr)) Print('2、遍历') for i in lst: print(i) for a in arr: print(a) print('3、定位') print(lst[4]) print(lst[-1]) print(arr[4]) print(arr[-1]) print('4、切片') print(lst[1:4:2]) print(arr[1:4:2]) print('4、修改') lst[1:3] = [55,100] arr[1:3] = [55,100] print(lst) print(arr) print('='*30)

3、基本运算

4、广播机制

5、索引和切片

6、常用操作

二、Pandas