在本文中,我们将为您详细介绍在python中搜索列表的最快方法的相关知识,并且为您解答关于python搜索列表的疑问,此外,我们还会提供一些关于python–从逻辑矩阵到集合列表的最快方式、Pytho
在本文中,我们将为您详细介绍在python中搜索列表的最快方法的相关知识,并且为您解答关于python 搜索列表的疑问,此外,我们还会提供一些关于python – 从逻辑矩阵到集合列表的最快方式、Python:创建n个列表的列表的最快方法、从Python中的字符串创建重叠子串列表的最快方法、在Python中,在具有特定扩展名的目录中构建文件列表的最快方法的有用信息。
本文目录一览:- 在python中搜索列表的最快方法(python 搜索列表)
- python – 从逻辑矩阵到集合列表的最快方式
- Python:创建n个列表的列表的最快方法
- 从Python中的字符串创建重叠子串列表的最快方法
- 在Python中,在具有特定扩展名的目录中构建文件列表的最快方法
在python中搜索列表的最快方法(python 搜索列表)
当您执行类似列表"test" ina
在哪里a
的操作时,python会在列表上进行顺序搜索吗?还是创建哈希表表示来优化查找?在应用程序中,我需要这样做,因为我将在列表上进行很多查找,所以最好先执行诸如此类的操作b= set(a)
,然后执行"test" in b
?还要注意,我将拥有的值列表将没有重复的数据,而且我实际上并不在乎它的顺序。我只需要能够检查值的存在。
答案1
小编典典还要注意,我将拥有的值列表将没有重复的数据,而且我实际上并不在乎它的顺序。我只需要能够检查值的存在。
不要使用列表,set()
而是使用列表。它完全具有您想要的属性,包括快速的in
测试。
我已经看到在一组更改一组列表的地方(大多数情况下是繁重的运算),速度提高了20倍以上。
python – 从逻辑矩阵到集合列表的最快方式
import numpy as np A = np.array([[1,1],[0,1,0],[1,0]]) rows,cols = A.shape C = np.nonzero(A) D = [set() for j in range(cols)] for i in range(len(C[0])): D[C[1][i]].add(C[0][i]) print D
解决方法
csc_matrix
,则可以使用indices和indptr属性来创建集合.
例如,
In [93]: A Out[93]: array([[1,0]]) In [94]: from scipy.sparse import csc_matrix In [95]: C = csc_matrix(A) In [96]: C.indptr Out[96]: array([ 0,5,8,12,16,20,23],dtype=int32) In [97]: C.indices Out[97]: array([0,2,3,4,6,7,3],dtype=int32) In [98]: D = [set(C.indices[C.indptr[i]:C.indptr[i+1]]) for i in range(C.shape[1])] In [99]: D Out[99]: [{0,5},{1,4},7},6},{0,3}]
对于数组而不是集合的列表,只需不要调用set():
In [100]: [C.indices[C.indptr[i]:C.indptr[i+1]] for i in range(len(C.indptr)-1)] Out[100]: [array([0,5],dtype=int32),array([1,4],7],6],array([0,dtype=int32)]
Python:创建n个列表的列表的最快方法
所以我想知道如何最好地创建一个空白列表的列表:
[[],[],[]...]
由于Python如何处理内存中的列表,因此不起作用:
[[]]*n
这确实会创建,[[],...]
但是每个元素都是相同的列表:
d = [[]]*n
d[0].append(1)
#[[1],[1],...]
类似于列表理解的作品:
d = [[] for x in xrange(0,n)]
但这使用Python VM进行循环。有什么方法可以使用隐式循环(利用C语言编写的代码)吗?
d = []
map(lambda n: d.append([]),xrange(0,10))
这实际上要慢一些。:(
从Python中的字符串创建重叠子串列表的最快方法
例如,对于6的n和字符串“hereismystring”,我将生成列表[“hereis”,“ereism”,“reismy”,…,“string”].我正在使用的琐碎代码现在看起来像这样:
n = 6 l = len(string) substrings = [string[i:(i + n)] for i in xrange(l - n + 1)]
很容易.问题是,我想加快速度(我有很多非常长的字符串). Python中有更快的技术吗?考虑到Python的字符串例程无论如何都会在C中下载到Cython帮助吗?
作为参考,这种技术在我的机器上需要大约100us(一个新的Macbook Pro),对于500长度的字符串和n为30.
我在这里先向您的帮助表示感谢!
解决方法
换句话说,当您想要使用子字符串时,只需直接从源字符串中读取范围.您将尽可能快地处理所需的字符,因为它们可以从缓存中提取.您可以将“子字符串”表示为源字符串中的偏移量.
有时,如果你想要超快的性能,你必须留下熟悉的数据结构.只是一个想法.
在Python中,在具有特定扩展名的目录中构建文件列表的最快方法
在GNU / Linux系统上的Python中,以递归方式扫描所有.MOV或.AVI文件的目录并将它们存储在列表中的最快方法是什么?
检查这个answer
我们今天的关于在python中搜索列表的最快方法和python 搜索列表的分享就到这里,谢谢您的阅读,如果想了解更多关于python – 从逻辑矩阵到集合列表的最快方式、Python:创建n个列表的列表的最快方法、从Python中的字符串创建重叠子串列表的最快方法、在Python中,在具有特定扩展名的目录中构建文件列表的最快方法的相关信息,可以在本站进行搜索。
本文标签: