NumPy排序和搜索功能

精华

小牛编辑

156浏览

2023-03-14

NumPy 提供了多种排序函数，这些排序函数可以实现不同的排序算法。

排序算法特征主要体现在以下四个方面：执行速度，最坏情况下的复杂度，所需的工作空间以及算法的稳定性。下表列举了三种排序算法：

NumPy排序算法
种类	速度	最坏复杂度	工作空间	稳定性
quicksort（快速排序）	1	O(n^2)	0	不稳定
mergesort（归并排序）	2	O(n * log(n)）	~n/2	稳定
heapsort（堆排序）	3	O(n * log(n))	0	不稳定

numpy.sort()

numpy.sort() 对输入数组执行排序，并返回一个数组副本。它具有以下参数：

numpy.sort(a, axis, kind, order)

参数说明：

a：要排序的数组；
axis：沿着指定轴进行排序，如果没有指定 axis，默认在最后一个轴上排序，若 axis=0 表示按列排序，axis=1 表示按行排序；
kind：默认为 quicksort（快速排序）；
order：若数组设置了字段，则 order 表示要排序的字段。

下面看一组示例：

import numpy as np 
a = np.array([[3,7],[9,1]]) 
print('a数组是：')
print(a)
#调用sort()函数
print(np.sort(a))
#按列排序：
print(np.sort(a, axis = 0))
#设置在sort函数中排序字段
dt = np.dtype([('name',  'S10'),('age',  int)])
a = np.array([("raju",21),("anil",25),("ravi",  17),  ("amar",27)], dtype = dt) 
#再次打印a数组
print(a)
#按name字段排序
print(np.sort(a, order = 'name'))

输出结果：

我们的数组是：
[[3 7]
[9 1]]

调用sort()函数：
[[3 7]
[1 9]]

按列排序：
[[3 1]
[9 7]]

再次打印a数组：
[(b'raju', 21) (b'anil', 25) (b'ravi', 17) (b'amar', 27)]
按name字段排序：
[(b'amar', 27) (b'anil', 25) (b'raju', 21) (b'ravi', 17)]

numpy.argsort()

argsort() 沿着指定的轴，对输入数组的元素值进行排序，并返回排序后的元素索引数组。示例如下：

import numpy as np 
a = np.array([90, 29, 89, 12]) 
print("原数组",a) 
sort_ind = np.argsort(a) 
print("打印排序元素索引值",sort_ind) 
#使用索引数组对原数组排序
sort_a = a[sort_ind] 
print("打印排序数组") 
for i in sort_ind: 
    print(a[i],end = " ")

输出结果：

原数组:
[90 29 89 12]
打印排序元素的索引数组：
[3 1 2 0]
打印排序数组：
12 29 89 90

numpy.lexsort()

numpy.lexsort() 按键序列对数组进行排序，它返回一个已排序的索引数组，类似于 numpy.argsort()。

下面看一组示例：

import numpy as np 
a = np.array(['a','b','c','d','e']) 
b = np.array([12, 90, 380, 12, 211]) 
ind = np.lexsort((a,b)) 
#打印排序元素的索引数组
print(ind) 
#使用索引数组对数组进行排序
for i in ind: 
    print(a[i],b[i])

输出结果：

打印排序元素的索引数组：
[0 3 1 4 2]
使用索引数组对原数组进行排序：
a 12
d 12
b 90
e 211
c 380

NumPy 提供了许多可以在数组内执行搜索功能的函数。比如查找最值或者满足一定条件的元素。

numpy.nonzero()

该函数从数组中查找非零元素的索引位置。示例如下：

import numpy as np 
 
b = np.array([12, 90, 380, 12, 211]) 
 
print("原数组b",b) 
 
print("打印非0元素的索引位置") 
 
print(b.nonzero())

输出结果：

原数组b
 [ 12  90 380  12 211]
打印非0元素的索引位置
(array([0, 1, 2, 3, 4]),)

numpy.where()

numpy.where() 的返回值是满足了给定条件的元素索引值。

import numpy as np 
 
b = np.array([12, 90, 380, 12, 211]) 
 
print(np.where(b>12)) 
 
c = np.array([[20, 24],[21, 23]]) 
 
print(np.where(c>20))

输出结果：

返回满足条件的索引数组
(array([1, 2, 4]),)
(array([0, 1, 1]), array([1, 0, 1]))

numpy.extract()

该函数的返回值是满足了给定条件的元素值，示例如下：

import numpy as np
x = np.arange(9.).reshape(3, 3)
打印数组x:'
print(x) 
#设置条件选择偶数元素
condition = np.mod(x,2)== 0
#输出布尔值数组
print(condition)
#按condition提取满足条件的元素值
print np.extract(condition, x)

输出结果：

a数组是：
[[0. 1. 2.]
[3. 4. 5.]
[6. 7. 8.]]
输出布尔值数组：
[[ True False  True]
[False  True False]
[ True False  True]]
按条件提取元素：
[0. 2. 4. 6. 8.]

numpy.argmax()

该函数返回最大值的的索引，与其相反的函数是 argmin() 求最小值索引，示例如下：

import numpy as np
a = np.array([[30,40,70],[80,20,10],[50,90,60]]) 
#a数组
print (a)
#argmax() 函数
print (np.argmax(a))
#将数组以一维展开
print (a.flatten())
#沿轴 0 的最大值索引：
maxindex = np.argmax(a, axis =  0) 
print (maxindex)
#沿轴 1 的最大值索引
maxindex = np.argmax(a, axis =  1) 
print (maxindex)

输出结果：

数组a:
[[30 40 70]
[80 20 10]
[50 90 60]]

调用 argmax() 函数：
7

展开数组：
[30 40 70 80 20 10 50 90 60]

沿轴 0 的最大值索引：
[1 2 0]

沿轴 1 的最大值索引：
[2 0 1]

numpy.argmin()

argmin() 求最小值索引。示例如下：

import numpy as np
b= np.array([[3,4,7],[8,2,1],[5,9,6]]) 
print  ('数组b：')
print (b) 
#调用 argmin()函数
minindex = np.argmin(b) 
print (minindex)
#展开数组中的最小值：
print (b.flatten()[minindex])
#沿轴 0 的最小值索引：
minindex = np.argmin(b, axis =  0) 
print (minindex)
#沿轴 1 的最小值索引：
minindex = np.argmin(b, axis =  1) 
print (minindex)

输出结果：

数组b：
[[3 4 7]
[8 2 1]
[5 9 6]]
返回最小索引值：
5
#展开数组中的最小值：
1
#沿轴 0 的最小值索引：
[0 1 1]
#沿轴 1 的最小值索引：
[0 2 0]