GVKun编程网logo

Python科学生态之 NumPy(numpy科学模式)

3

本文将介绍Python科学生态之NumPy的详细情况,特别是关于numpy科学模式的相关信息。我们将通过案例分析、数据研究等多种方式,帮助您更全面地了解这个主题,同时也将涉及一些关于"importnu

本文将介绍Python科学生态之 NumPy的详细情况,特别是关于numpy科学模式的相关信息。我们将通过案例分析、数据研究等多种方式,帮助您更全面地了解这个主题,同时也将涉及一些关于"import numpy as np" ImportError: No module named numpy、3.7Python 数据处理篇之 Numpy 系列 (七)---Numpy 的统计函数、Anaconda Numpy 错误“Importing the Numpy C Extension Failed”是否有另一种解决方案、Difference between import numpy and import numpy as np的知识。

本文目录一览:

Python科学生态之 NumPy(numpy科学模式)

Python科学生态之 NumPy(numpy科学模式)

未经许可,不得转载
时间:2020年1月17日17:33:15
created by:Tower
使用JupyterNotebook编辑

0x00 前言(NumPy 的设计理念)

对于一个技术的使用或许记背几个常用的函数和基本用法便好,但要理解一个技术和工具,设计理念便是其内核之一,就是文章诗词的风骨,嚼起来才有味道,本部分介绍一些NumPy的优秀设计理念,当然,这些不是Numpy所独有,在介绍时可以思考你学过的别的技术或优秀工具框架同质

0.1 Python的基本数据类型 vs Numpy提供的array数据类型

Python的对象:

  • 高级数据对象:integers(整型数据),floating point(浮点数)
  • 容器:list(列表:插入和追加),dict(字典:快速查找)

对比C语言等大多数语言,想一想缺少了什么?
<p>没有数组</p>

NumPy提供:

  • 多维数组
  • 接近硬件(高效)
  • 为科学计算而设计(便捷)
  • 面向数组计算

<p>提取一下关键词:数组,接近硬件运行很快的数组,多维数组</p>

容易得出,Python没有提供基础的连续内存空间的数据类型,只有更高层次的基于抽象模型的列表和字典两种抽象数据类型,对于使用编程语言的用户确实方便了,需要时,也可以用list来模拟一下数组类型进行操作,但是一到需要性能要求很高的计算,Python就显得能力不足了,而这,恰恰就是NumPy所提供的(从此以后,Python的数据类型便可以覆盖所有基础类型),这也是为什么多数数据处理多且对性能要求高的模块软件或工具都会依赖Numpy,比如二维绘图的matplotlib,比如pandas,可以说,无论科学计算领域还是其他领域,NumPy和字符串数据类型一样重要,甚至有过之而无不及

总之,Python缺少的能力,NumPy完美的完成了,还超额完成了

当然我提到了,NumPy比list等容器要快吧,那么快多少呢?口说无凭,来试验一下

0.2 NumPy的实现速度(底层用编译语言实现)
L = range(1000)
%timeit [i**2 for i in L]
323 µs ± 4.96 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


import numpy as np
a = np.arange(1000)
%timeit a**2
1.48 µs ± 7.63 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

<p>numpy约是list的218倍(323/1.48)!!!!!</p>

你现在应该不会动摇学习NumPy基本使用的想法了
我也相信希望你看完本篇文章会对NumPy有相当程度的理解

你是否会想知道怎么会快这么多?

从解释的脚本语言特点与编译语言的特性,从NumPy的实现与优化,从list和NumPy分别在哪一个计算机层次上的实现等都有它的叙述,终归于一点,NumPy的官方文档也是这么概要:NumPy是Python脚本语言调用接近硬件的C等编译语言实现的。暂时能有概念上的大致理解便好。

0.3 NumPy的内部设计(arrays对象,统一操作接口)

NumPy内部结构比较复杂,为了用户方便操作,它提供了arrays对象的统一操作接口,对于整个NumPy库的各种操作使用arrays对象的统一操作接口对外提供,在Python编程时,这个arrays的使用和其他的str,list,dict对象保持一致,简约统一

这种设计在很多优秀的工具库都能看到,比如马上要介绍的Matplotlib库的pyplot对象也是担当了面向用户的统一操作接口功能,对于调用者,看不到内部的为追求功能多和优化后的复杂,在设计自己的库的时候,也应根据辛苦,融入这种软件工程的设计原则

Ok,目前就介绍这些,下面开始NumPy入门

0.4 Numpy数据对象的操作

NumPy的基本设计,致力于打造符合大家对于数组常用的操作标准,有标准,就方便他人迁移和快速上手,比如Java,C或其他语言来的,能快速根据原来语言的认知,快速高效的使用。主体会在数组的运算一小节具体介绍。

0x01 NumPy库入门

在此部分,我们首先介绍数组的类型的一些基本概念,这些概念都是标准化的,在NumPy中有,在其他语言的数组数据结构一样有,可以说属于数据结构的理论内容
接着,会介绍数组的创建方法,访问方法以及基本运算

1.0 数组定义

代码说话,他长这样

import numpy as np
arr = np.linspace(1,100,30)
print(arr)
[  1.           4.4137931    7.82758621  11.24137931  14.65517241
  18.06896552  21.48275862  24.89655172  28.31034483  31.72413793
  35.13793103  38.55172414  41.96551724  45.37931034  48.79310345
  52.20689655  55.62068966  59.03448276  62.44827586  65.86206897
  69.27586207  72.68965517  76.10344828  79.51724138  82.93103448
  86.34482759  89.75862069  93.17241379  96.5862069  100.        ]

1.1 数据的维度和数组(Dimension,D)

概念自定
什么叫做维?

符合概念的叫做模型,就像是类和他的对象
我先介绍几个不同维的模型,先有一个模糊的印象

  • 物理里的长,宽,高
  • 数学里的点,线,面
  • 人体感知可以有视觉,听觉,嗅觉
  • 西瓜有 色泽,根蒂,敲声

(你把关系数据的基本概念,比如属性,也是可以类比的,)

一个数据表达一个含义,
一组数据表达一个或多个含义

什么叫维度?

维度(Dimension),又称为维数,是数学中独立参数的数目。
从广义上讲:维度是事物“有联系”的抽象概念的数量,“有联系”的抽象概念指的是由多个抽象概念联系而成的抽象概念,和任何一个组成它的抽象概念都有联系,组成它的抽象概念的个数就是它变化的维度。

什么叫数组?
一组数,但是考虑到实现的问题,他又会有不同的限制,

  1. 数组长度定义好后就不能改了
  2. 数组的元素必须是同类型
  3. 数组的内存模型也必须是线性的

概念对比

维VS属性:
在很多不同的领域,这两者几乎可以替换,在周志华人工智能的西瓜书里,
西瓜的色泽,根蒂,敲声就是三个不同的属性,我们可以用三个维的数据组织形式来表达这三个属性的数据集,同样,我们也可以用关系型数据库来存储这三个属性和属性值(当然,关系数据关注的是关系范式,属性是表示数据的概念而已)。

数组维VS线性代数:
在线性代数中,我们有不同的生成子空间的概念,
而子空间,就有0维,1维,2维等不同的子空间,其次,向量的表达不就是数组的形式嘛,怎么就能表达不同的维了呢?是不是感觉和之前所说的以及一直对维的理解有很大矛盾呢?在次不予以说明,能理清这两个区别和共性是辨别你是否理解维和属性的概念的标志。

通俗表达
上面的解释是教学型文章的败笔,一个概念没有说清楚呢,倒是来了一堆的新概念、

那我来个通俗的说法吧:
一个数据叫0维数组:
如12,-23,一个对象

一群数,按照线性排列叫1维数组:
排个队:[12,34,44,35,12,34,45]

一群数,组成一维数组后,跑到另外一个数组去当元素,继续线性排队,就是2维数组啦,就是说一位数组的元素是一个数组:
[[],[],[],[],[],[]]
填上数据:
[12,23,34,56,[12,34,23,54],[121,34,56,23]]

三维数组等高维数组,就可以这样递归的定义下去,如,三维数组,就是一维数组的元素是一维数组,这个二等数组的元素又是一维数组,这个三等数组的元素还是一维数...,哦不,是0维数组了,或者就是一个数

1.2 ndarray对象(大门)

NumPy是一个开源的Python科学计算基础库,包含:

  • 一个强大的N维数组对象 ndarray
  • 广播功能函数
  • 整合C/C++/Fortran代码的工具
  • 线性代数、傅里叶变换、随机数生成等功能
NumPy 的引用:
import NumPy as np
这里取个别名叫np是通用标准,全世界都这么干,你能这么应用取别名,就和国际接轨了

ndarray是一个多维数组对象,由两部分构成:

  • 实际的数据
  • 描述这些数据的元数据(数据维度、数据类型等)

ndarray数组一般要求所有元素类型相同(同质),数组下标从0开始

ndarry在程序中的别名是 array,这才和Python的str list等统一表述嘛

轴(axis): 保存数据的维度;秩(rank):轴的数量

ndarray对象的属性:

属性 说明
.ndim dimension,维数,即轴的数量,秩
.shape ndarray对象的尺度,形状,矩阵的n行m列
.size ndarray对象的大小,元素的个数,n*m
.dtype ndarray对象的元素类型
.itemsize ndarray的每个元素的大小,以字节为单位
a = np.array([[12,23,34,56],[23,45,43,56],[12,34,23,54],[121,34,56,23]])
print(a)
print(''a.ndim:{}''.format(a.ndim))
print(''a.shape:{}''.format(a.shape))
print(''a.size:{}''.format(a.size))
print(''a.dtype:{}''.format(a.dtype))
print(''a.itemsize:{}''.format(a.itemsize))
[[ 12  23  34  56]
 [ 23  45  43  56]
 [ 12  34  23  54]
 [121  34  56  23]]
a.ndim:2
a.shape:(4, 4)
a.size:16
a.dtype:int32
a.itemsize:4

ndarray的元素类型

数据类型 说明
bool 布尔类型, True或False
整数
intc 与C语言中的int类型一致,一般是int32或int64
intp 用于索引的整数,与C语言中ssize_t一致, int32或int64
int8 字节长度的整数,取值: [‐128, 127]
int16 16位长度的整数,取值: [‐32768, 32767]
int32 32位长度的整数,取值: [‐231, 231‐1]
int64 64位长度的整数,取值: [‐263, 263‐1]
各种字节长度的无符号数
uint8 8位无符号整数,取值: [0, 255]
uint16 16位无符号整数,取值: [0, 65535]
uint32 32位无符号整数,取值: [0, 232‐1]
uint64 32位无符号整数,取值: [0, 264‐1]
IEEE754标准浮点数
float16 16位半精度浮点数: 1位符号位, 5位指数(符号)尾数*1, 10位尾数
float32 32位半精度浮点数: 1位符号位, 8位指数, 23位尾数
float64 64位半精度浮点数: 1位符号位, 11位指数, 52位尾数
complex64 复数类型,实部和虚部都是32位浮点数
complex128 复数类型,实部和虚部都是64位浮点数

对比:Python语法仅支持整数、浮点数和复数3种类型
精细化数据管理好处:

  • 科学计算涉及数据较多,对存储和性能都有较高要求
  • 对元素类型精细定义,有助于NumPy合理使用存储空间并优化性能
  • 对元素类型精细定义,有助于程序员对程序规模有合理评估

特点:数据占用内存大小很精准,适合各种场景数据要求,如此精致,可见一斑

1.3 ndarray数组的创建方法
  1. 从Python中的列表、元组等类型创建指定数据的ndarray数组
np.array(object, dtype=None, copy=True, order=''K'', subok=False, ndim=0)->narray

x = np.array(list/tuple)
x = np.array(list/tuple, dtpyt=np.float32)
  1. 使用NumPy中函数创建ndarray数组,如: arange, ones, zeros等,创建特征数组
函数 说明
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n‐1
np.ones(shape) 根据shape生成一个全1数组, shape是元组类型
np.zeros(shape) 根据shape生成一个全0数组, shape是元组类型
np.full(shape,val) 根据shape生成一个数组,每个元素值都是val
np.eye(n) 创建一个正方的n*n单位矩阵,对角线为1,其余为0
从已知形状的数组arr创造相同形状的特征数组
np.ones_like(arr) 根据数组a的形状生成一个全1数组
np.zeros_like(arr) 根据数组a的形状生成一个全0数组
np.full_like(arr,val) 根据数组a的形状生成一个数组,每个元素值都是val
np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组
import numpy as np
np.arange(8)
array([0, 1, 2, 3, 4, 5, 6, 7])



import numpy as np
np.ones((3,6))
array([[1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.]])



import numpy as np
np.zeros((2,3,4))
array([[[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]],

       [[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]]])



import numpy as np
np.full((2,3,4),3.88)
array([[[3.88, 3.88, 3.88, 3.88],
        [3.88, 3.88, 3.88, 3.88],
        [3.88, 3.88, 3.88, 3.88]],

       [[3.88, 3.88, 3.88, 3.88],
        [3.88, 3.88, 3.88, 3.88],
        [3.88, 3.88, 3.88, 3.88]]])



import numpy as np
np.eye(5)
array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])


1.3 ndarray数组的变换

数组的变换主要指的是对已存在的数组进行维度和数据类型的变换

  • 维度变换
方法 说明
维度变换
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变
元素数据类型变换
arr.astype(new_type) 创建新的数组,以指定的数据类型
ndarry数据类型变换
arr.tolist() 将NumPy的array类型的数组装换为Python的list类型
1.4 数组的切片和索引

索引:给出数组元素的“位置”获得元素的值,取得单个元素
切片:给出数组元素的“区域”获得整体数组元素子集的操作,取得多个元素(新的“子”数组)

一维数组的索引与切片:同Python的list类似


a=np.array([1,2,3,4,5,6,7,8,9])

a[2]
# 3
a[1:7:2]
# startIndex:endIndex:stepLength,从startIndex到endIndex前闭后开区间以stepLength为步长的数组,支持负数的反向索引
#array([2,4,6])

高维数组索引与切片

可理解为对每一维数据的切片索引后的复合,用‘,’划分

import numpy as np

a = np.arange(36)
a = a.reshape((3,3,4))
print(''a'')
print(a)
print(''a[2,1,-3]'')
print(a[2,1,-3])
print(''a[:,1:3,:]'')
print(a[:,1:3,:])
print(''a[:,:,::2]'')
print(a[:,:,::2])

# 可以当做坐标来理解
a
[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]

 [[24 25 26 27]
  [28 29 30 31]
  [32 33 34 35]]]
a[2,1,-3]
29
a[:,1:3,:]
[[[ 4  5  6  7]
  [ 8  9 10 11]]

 [[16 17 18 19]
  [20 21 22 23]]

 [[28 29 30 31]
  [32 33 34 35]]]
a[:,:,::2]
[[[ 0  2]
  [ 4  6]
  [ 8 10]]

 [[12 14]
  [16 18]
  [20 22]]

 [[24 26]
  [28 30]
  [32 34]]]

高级操作索引

  • a[a<0]=0

对数组中小于0的元素置0

1.4 数组的运算
  1. 数组与标量的运算

    对所有元素的运算

import numpy as np

a = np.linspace(1,49,24,endpoint=False).reshape((2,3,4))
print(a)
a = a/a.mean()
print(a)

# 每一个元素除以数据的平均值
[[[ 1.  3.  5.  7.]
  [ 9. 11. 13. 15.]
  [17. 19. 21. 23.]]

 [[25. 27. 29. 31.]
  [33. 35. 37. 39.]
  [41. 43. 45. 47.]]]
[[[0.04166667 0.125      0.20833333 0.29166667]
  [0.375      0.45833333 0.54166667 0.625     ]
  [0.70833333 0.79166667 0.875      0.95833333]]

 [[1.04166667 1.125      1.20833333 1.29166667]
  [1.375      1.45833333 1.54166667 1.625     ]
  [1.70833333 1.79166667 1.875      1.95833333]]]

  1. NumPy 一元运算函数

fun(x)/x.fun()

函数 说明
np.abs(x) np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) 计算数组各元素的自然对数、 10底对数和2底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值 或 floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x) np.sin(x) np.sinh(x) np.tan(x) np.tanh(x) 计算数组各元素的普通型和双曲型三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值, 1(+), 0, ‐1(‐)
  1. NumPy 二元运算函数

fun(x,y)/x.fun(y)

函数 说明
+ ‐ * / ** 两个数组各元素进行对应运算(操作符重载函数)
np.maximum(x,y) np.fmax() np.minimum(x,y) np.fmin() 元素级的最大值/最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == != 算术比较,产生布尔型数组

两数组不同质(形状不同)
此时,两数组运算使用broadcasting机制

0x02 数组数据的存取

2.0 区分一维数组和多维数组

数组的一个特点是:在物理内存中存储在连续的内存空间

0x00 0x01 0x02 0x03 0x04 0x05 0x06 0x07
12 34 45 65 43 32 23 45

数据本身是没有数组形状的信息的,他只是每个元素的值存在每个内存单元中

所以,我们在使用数组时,我们需要存储数组的形状信息
我们可以将一个数组对象数据分为数据头和数据体,数据头存储数组对象的形状,而数据体即内存中的元素值

于是,我们可以通过使用函数a.resize(shape),reshape等函数来改变数据头中的关于形状的信息,当我们使用数组,比如索引数组元素时,配合数据头,来找到对应的数据

理解数组的维数是如何实现的,我们再来谈论数组数据的存储:

2.1 CSV文件(1-D或2-D数组存取)

CSV文件:Comma-Separated Value(逗号分隔值) 文件
比如:

城市,环比,同比,定基
北京,101.5,120.7,121.4
上海,101.2,127.3,127.8
广州,101.3,119.4,120.0
深圳,102.0,140.9,145.5
沈阳,100.1,101.4,101.6

可以看出,只有逗号分隔,格式简单,易于理解,同时,限制了CSV只能存取一维数组和二维数组

np.savetxt(frame, array, fmt=''%.18e'', delimiter=None)

  • frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • array : 存入文件的数组
  • fmt : 写入文件的格式,例如: %d %.2f %.18e
  • delimiter : 分割字符串,默认是任何空格


np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)

  • frame : 文件、字符串或产生器,可以是.gz或.bz2的压缩文件
  • dtype : 数据类型,可选
  • delimiter : 分割字符串,默认是任何空格
  • unpack : 如果True,读入属性将分别写入不同变量
2.2 二进制文件(可适用高维数组)

tofile(frame, sep='''', format=''%s'')

  • frame : 文件、字符串
  • sep : 数据分割字符串,如果是空串,写入文件为二进制
  • format : 写入数据的格式

fromfile(frame, dtype=float, count=‐1, sep='''')

  • frame : 文件、字符串
  • dtype : 读取的数据类型
  • count : 读入元素个数, ‐1表示读入整个文件
  • sep : 数据分割字符串,如果是空串,写入文件为二进制
2.3 NumPy文件(可适用高维数组)


np.save(fname, array) 或 np.savez(fname, array)

  • fname : 文件名,以.npy为扩展名,压缩扩展名为.npz
  • array : 数组变量

np.load(fname)

  • fname : 文件名,以.npy为扩展名,压缩扩展名为.npz

0x03 NumPy的函数

3.1 随机函数子库 numpy.random库
函数 说明
np.random.rand(d0,d1,..,dn) 根据d0‐dn创建随机数数组,浮点[0,1),均匀分布
np.random.randn(d0,d1,..,dn) 根据d0‐dn创建随机数数组,标准正态分布
np.random.randint(low[,high,shape]) 根据shape创建随机整数或整数数组,范围是[low, high)
np.random.seed(s) 随机数种子, s是给定的种子值
shuffle(a) 根据数组a的第1轴进行随排列,改变数组x
permutation(a) 根据数组a的第1轴产生一个新的乱序数组,不改变数组x
choice(a[,size,replace,p]) 从一维数组a中以概率p抽取元素,形成size形状新数组,replace表示是否可以重用元素,默认为False
uniform(low,high,size) 产生具有均匀分布的数组,low起始值,high结束值,size形状
normal(loc,scale,size) 产生具有正态分布的数组,loc均值,scale标准差,size形状
poisson(lam,size) 产生具有泊松分布的数组,lam随机事件发生率,size形状
3.1 统计函数
函数 说明
sum(a, axis=None) 根据给定轴axis计算数组a相关元素之和, axis整数或元组
mean(a, axis=None) 根据给定轴axis计算数组a相关元素的期望, axis整数或元组
average(a,axis=None,weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
std(a, axis=None) 根据给定轴axis计算数组a相关元素的标准差
var(a, axis=None) 根据给定轴axis计算数组a相关元素的方差
min(a) max(a) 计算数组a中元素的最小值、最大值
argmin(a) argmax(a) 计算数组a中元素最小值、最大值的降一维后下标
unravel_index(index, shape) 根据shape将一维下标index转换成多维下标
ptp(a) 计算数组a中元素最大值与最小值的差
median(a) 计算数组a中元素的中位数(中值)
3.2 梯度函数
函数 说明
np.gradient(f) 计算数组f中元素的梯度,当f为多维时,返回每个维度梯度

0x04 副本(Copies)和视图(View)

在前面的一些基本函数介绍,有些函数返回一个新的数组(称为copies),但有些少量函数则不会

view:切片操作会产生一个view

  • view只是一种访问数组的方式
  • 切片不会重新在新的内存创建数组
  • 当修改视图时,本质是对原数组的修改
可以使用copy()函数对view创建副本
newArr = arr[:,:,2].copy()
此时对newArr的元素值修改不会影响到arr

当我们的数据量稍微有点大,或我们需要对局部数据修改,或整体数据的局部以不同的组织方式出现对我们有价值的情况下,我们常常会引入view机制
回想一下关系数据库,我们是否经常在模型的基础上创建view,来实现访问控制或数据接口统一等目的

copy:会新申请内存空间,存储数据,此时,对新数组操作便不会影响到旧数组,在旧数组的基础上添加条件而新创建的数组称之为旧数组的copy

One More Thing

  • copy和view的概念很简单,但是稍不注意,就会出现你不期望的奇怪情况,比如你要操作的数组数据被修改而自己不知道(往往因为你在别的地方操作了该数组的view,但自己却没有关注),这在不熟悉某些操作函数的返回值是view还是copy时容易发生
  • copy和view是深拷贝和浅拷贝概念的衍生
  • 好在多数view由切片产生,多数数组的函数操作返回值都是copy

0x05 基本的数据可视化

此处只简单介绍matplotlib模块pyploy库的plot()函数

import matplotlib.pyplot as plt
import numpy as np
#准备 变量x的数据,数组
x = np.linspace(0,100,20000)
#准备 变量y的数据,数组
y = np.cos(x)
#使用ploy()可视化
plt.plot(x,y)

0x06 高阶操作

2-D array 和 线性代数

numpy.linalg子库实现了基本的线性代数功能,比如解线性系统,SVD分解等,由于numpy的实现并不一定高效,所以,我们更多使用scipy模块的linalg子库进行操作,此处不详细介绍,可参考(scipy.linalg)[https://docs.scipy.org/doc/sc...]

多项式操作

在numpy.polynomial子库提供了多项式的相关操作

import numpy as np
import matplotlib.pyplot as plt

# 多项式
p = np.polynomial.Polynomial([-1,2,3])
print(p(0))
print(p.roots())
print(p.degree())

#契比雪夫多项式
x=np.linspace(-1,1,2000)
y=np.cos(x)+ 0.3*np.random.rand(2000)
p=np.polynomial.Chebyshev.fit(x,y,90)
t=np.linspace(-1,1,200)
plt.plot(x,y,''r'')
plt.plot(t,p(t),''k-'',lw=3)
-1.0
[-1.          0.33333333]
2

0x06 后记

NumPy为Python提供了ndarray数据类型,弥补了没有数组类型只能使用list来模拟的窘境,更加提供了适合科学计算的高效函数,是学习Python做计算科学的最基础,务必重视

本人能力有限,难免有不完备和错误的地方,欢迎指正。

欢迎关注微信公众号:技术复兴

"import numpy as np" ImportError: No module named numpy

问题:没有安装 numpy

解决方法:

下载文件,安装

numpy-1.8.2-win32-superpack-python2.7

安装运行 import numpy,出现

Traceback (most recent call last):
  File "<pyshell#2>", line 1, in <module>
    import numpy
  File "C:\Python27\lib\site-packages\numpy\__init__.py", line 153, in <module>
    from . import add_newdocs
  File "C:\Python27\lib\site-packages\numpy\add_newdocs.py", line 13, in <module>
    from numpy.lib import add_newdoc
  File "C:\Python27\lib\site-packages\numpy\lib\__init__.py", line 8, in <module>
    from .type_check import *
  File "C:\Python27\lib\site-packages\numpy\lib\type_check.py", line 11, in <module>
    import numpy.core.numeric as _nx
  File "C:\Python27\lib\site-packages\numpy\core\__init__.py", line 6, in <module>
    from . import multiarray
ImportError: DLL load failed: %1 不是有效的 Win32 应用程序。

原因是:python 装的是 64 位的,numpy 装的是 32 位的

重新安装 numpy 为:numpy-1.8.0-win64-py2.7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.7Python 数据处理篇之 Numpy 系列 (七)---Numpy 的统计函数

3.7Python 数据处理篇之 Numpy 系列 (七)---Numpy 的统计函数

目录

[TOC]

前言

具体我们来学 Numpy 的统计函数

(一)函数一览表

调用方式:np.*

.sum(a) 对数组 a 求和
.mean(a) 求数学期望
.average(a) 求平均值
.std(a) 求标准差
.var(a) 求方差
.ptp(a) 求极差
.median(a) 求中值,即中位数
.min(a) 求最大值
.max(a) 求最小值
.argmin(a) 求最小值的下标,都处里为一维的下标
.argmax(a) 求最大值的下标,都处里为一维的下标
.unravel_index(index, shape) g 根据 shape, 由一维的下标生成多维的下标

(二)统计函数 1

(1)说明

(2)输出

.sum(a)

.mean(a)

.average(a)

.std(a)

.var(a)

(三)统计函数 2

(1)说明

(2)输出

.max(a) .min(a)

.ptp(a)

.median(a)

.argmin(a)

.argmax(a)

.unravel_index(index,shape)

作者:Mark

日期:2019/02/11 周一

Anaconda Numpy 错误“Importing the Numpy C Extension Failed”是否有另一种解决方案

Anaconda Numpy 错误“Importing the Numpy C Extension Failed”是否有另一种解决方案

如何解决Anaconda Numpy 错误“Importing the Numpy C Extension Failed”是否有另一种解决方案?

希望有人能在这里提供帮助。我一直在绕圈子一段时间。我只是想设置一个 python 脚本,它将一些 json 数据从 REST API 加载到云数据库中。我在 Anaconda 上设置了一个虚拟环境(因为 GCP 库推荐这样做),安装了依赖项,现在我只是尝试导入库并向端点发送请求。 我使用 Conda(和 conda-forge)来设置环境并安装依赖项,所以希望一切都干净。我正在使用带有 Python 扩展的 VS 编辑器作为编辑器。 每当我尝试运行脚本时,我都会收到以下消息。我已经尝试了其他人在 Google/StackOverflow 上找到的所有解决方案,但没有一个有效。我通常使用 IDLE 或 Jupyter 进行脚本编写,没有任何问题,但我对 Anaconda、VS 或环境变量(似乎是相关的)没有太多经验。 在此先感谢您的帮助!

  \Traceback (most recent call last):
File "C:\Conda\envs\gcp\lib\site-packages\numpy\core\__init__.py",line 22,in <module>
from . import multiarray
File "C:\Conda\envs\gcp\lib\site-packages\numpy\core\multiarray.py",line 12,in <module>
from . import overrides
File "C:\Conda\envs\gcp\lib\site-packages\numpy\core\overrides.py",line 7,in <module>
from numpy.core._multiarray_umath import (
ImportError: DLL load Failed while importing _multiarray_umath: The specified module Could not be found.

During handling of the above exception,another exception occurred:

Traceback (most recent call last):
File "c:\API\citi-bike.py",line 4,in <module>
import numpy as np
File "C:\Conda\envs\gcp\lib\site-packages\numpy\__init__.py",line 150,in <module>
from . import core
File "C:\Conda\envs\gcp\lib\site-packages\numpy\core\__init__.py",line 48,in <module>
raise ImportError(msg)
ImportError:

IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE!

Importing the numpy C-extensions Failed. This error can happen for
many reasons,often due to issues with your setup or how NumPy was
installed.

We have compiled some common reasons and troubleshooting tips at:

https://numpy.org/devdocs/user/troubleshooting-importerror.html

Please note and check the following:

* The Python version is: python3.9 from "C:\Conda\envs\gcp\python.exe"
* The NumPy version is: "1.21.1"

and make sure that they are the versions you expect.
Please carefully study the documentation linked above for further help.

Original error was: DLL load Failed while importing _multiarray_umath: The specified module Could not be found.

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

Difference between import numpy and import numpy as np

Difference between import numpy and import numpy as np

Difference between import numpy and import numpy as np

up vote 18 down vote favorite

5

I understand that when possible one should use

import numpy as np

This helps keep away any conflict due to namespaces. But I have noticed that while the command below works

import numpy.f2py as myf2py

the following does not

import numpy as np
np.f2py #throws no module named f2py

Can someone please explain this?

python numpy

shareimprove this question

edited Mar 24 ''14 at 23:20

mu 無

24.7k104471

asked Mar 24 ''14 at 23:19

user1318806

3001311

 
1  

@roippi have you tried exit your python and enter it and just do import numpy then numpy.f2py ? It throws an error in my case too – aha Mar 24 ''14 at 23:24

1  

Importing a module doesn''t import sub-modules. You need to explicitly import the numpy.f2py module regardless of whether or not/how numpy itself has been imported. – alecb Mar 24 ''14 at 23:39

add a comment

4 Answers

active oldest votes

 

up vote 13 down vote

numpy is the top package name, and doing import numpy doesn''t import submodule numpy.f2py.

When you do import numpy it creats a link that points to numpy, but numpy is not further linked to f2py. The link is established when you do import numpy.f2py

In your above code:

import numpy as np # np is an alias pointing to numpy, but at this point numpy is not linked to numpy.f2py
import numpy.f2py as myf2py # this command makes numpy link to numpy.f2py. myf2py is another alias pointing to numpy.f2py as well

Here is the difference between import numpy.f2py and import numpy.f2py as myf2py:

  • import numpy.f2py
    • put numpy into local symbol table(pointing to numpy), and numpy is linked to numpy.f2py
    • both numpy and numpy.f2py are accessible
  • import numpy.f2py as myf2py
    • put my2py into local symbol table(pointing to numpy.f2py)
    • Its parent numpy is not added into local symbol table. Therefore you can not access numpy directly

shareimprove this answer

edited Mar 25 ''14 at 0:31

answered Mar 24 ''14 at 23:33

aha

1,2291718

 

add a comment

 

up vote 7 down vote

The import as syntax was introduced in PEP 221 and is well documented there.

When you import a module via

import numpy

the numpy package is bound to the local variable numpy. The import as syntax simply allows you to bind the import to the local variable name of your choice (usually to avoid name collisions, shorten verbose module names, or standardize access to modules with compatible APIs).

Thus,

import numpy as np

is equivalent to,

import numpy
np = numpy
del numpy

When trying to understand this mechanism, it''s worth remembering that import numpy actually means import numpy as numpy.

When importing a submodule, you must refer to the full parent module name, since the importing mechanics happen at a higher level than the local variable scope. i.e.

import numpy as np
import numpy.f2py   # OK
import np.f2py      # ImportError

I also take issue with your assertion that "where possible one should [import numpy as np]". This is done for historical reasons, mostly because people get tired very quickly of prefixing every operation with numpy. It has never prevented a name collision for me (laziness of programmers actually suggests there''s a higher probability of causing a collision with np)

Finally, to round out my exposé, here are 2 interesting uses of the import as mechanism that you should be aware of:

1. long subimports

import scipy.ndimage.interpolation as warp
warp.affine_transform(I, ...)

2. compatible APIs

try:
    import pyfftw.interfaces.numpy_fft as fft
except:
    import numpy.fft as fft
# call fft.ifft(If) with fftw or the numpy fallback under a common name

shareimprove this answer

answered Mar 25 ''14 at 0:59

hbristow

68345

 

add a comment

 

up vote 1 down vote

numpy.f2py is actually a submodule of numpy, and therefore has to be imported separately from numpy. As aha said before:

When you do import numpy it creats a link that points to numpy, but numpy is not further linked to f2py. The link is established when you do import numpy.f2py

when you call the statement import numpy as np, you are shortening the phrase "numpy" to "np" to make your code easier to read. It also helps to avoid namespace issues. (tkinter and ttk are a good example of what can happen when you do have that issue. The UIs look extremely different.)

shareimprove this answer

answered Mar 24 ''14 at 23:47

bspymaster

760923

 

add a comment

 

up vote 1 down vote

This is a language feature. f2py is a subpackage of the module numpy and must be loaded separately.

This feature allows:

  • you to load from numpy only the packages you need, speeding up execution.
  • the developers of f2py to have namespace separation from the developers of another subpackage.

Notice however that import numpy.f2py or its variant import numpy.f2py as myf2py are still loading the parent module numpy.

Said that, when you run

import numpy as np
np.f2py

You receive an AttributeError because f2py is not an attribute of numpy, because the __init__() of the package numpy did not declare in its scope anything about the subpackage f2py.

shareimprove this answer

answered Mar 24 ''14 at 23:57

gg349

7,67321739

 
    

when you do import numpy.f2py as myf2py, how do you access its parent numpy? it seems import numpy.f2py allows you to access its parent numpy, but import numpy.f2py as myf2py doesn''t – aha Mar 25 ''14 at 0:00

    

You don''t access it because you decided you didn''t want to use anything from numpy, and you only care of using the subpackage. It is similar to using from foo import bar: the name foo will not be accessible. See the comment after the first example of the docs, LINK – gg349 Mar 25 ''14 at 0:05

add a comment

关于Python科学生态之 NumPynumpy科学模式的问题就给大家分享到这里,感谢你花时间阅读本站内容,更多关于"import numpy as np" ImportError: No module named numpy、3.7Python 数据处理篇之 Numpy 系列 (七)---Numpy 的统计函数、Anaconda Numpy 错误“Importing the Numpy C Extension Failed”是否有另一种解决方案、Difference between import numpy and import numpy as np等相关知识的信息别忘了在本站进行查找喔。

本文标签: