python 标准库 functools 高阶函数工具
每日一词:
这里我们换种记忆方法 ,词根 tach
代表 固定
attach
英 [əˈtætʃ] 美 [əˈtætʃ]
vt.& vi. 贴上,系; 附上;
vt.(有时不受欢迎或未受邀请而)参加; 把…固定; 把…归因于; (使)与…有联系
vi. 从属; 附着; 伴随而来; 联在一起(to, upon)
attachment n 邮件的附件
de 是反义前缀
detach v 分离
detached adj 冷漠的,离群的
detachment n 公平
functools
模块应用于高阶函数,即参数或(和)返回值为其他函数的函数。 通常来说,此模块的功能适用于所有可调用对象。
函数
functools
模块定义了以下函数:
`@functools.cached_property`(func)
将一个类方法转换为特征属性,一次性计算该特征属性的值,然后将其缓存为实例生命周期内的普通属性。 类似于
property()
但增加了缓存功能。 对于在其他情况下实际不可变的高计算资源消耗的实例特征属性来说该函数非常有用。示例:
1
2
3
4
5
6
7
8
9
10
11class DataSet:
def __init__(self, sequence_of_numbers):
self._data = sequence_of_numbers
def stdev(self):
return statistics.stdev(self._data)
def variance(self):
return statistics.variance(self._data)3.8 新版功能.
此装饰器要求每个实例上的
__dict__
属性是可变的映射。 这意味着它将不适用于某些类型,例如元类(因为类型实例上的__dict__
属性是类命名空间的只读代理),以及那些指定了__slots__
但未包含__dict__
作为所定义的空位之一的类(因为这样的类根本没有提供__dict__
属性)。functools.cmp_to_key
(func)将(旧式的)比较函数转换为新式的 key function . 在类似于
sorted()
,min()
,max()
,heapq.nlargest()
,heapq.nsmallest()
,itertools.groupby()
等函数的 key 参数中使用。此函数主要用作将 Python 2 程序转换至新版的转换工具,以保持对比较函数的兼容。比较函数意为一个可调用对象,该对象接受两个参数并比较它们,结果为小于则返回一个负数,相等则返回零,大于则返回一个正数。key function则是一个接受一个参数,并返回另一个用以排序的值的可调用对象。示例:
1
sorted(iterable, key=cmp_to_key(locale.strcoll)) # locale-aware sort order
有关排序示例和简要排序教程,请参阅 排序指南 。3.2 新版功能.
`@functools.lru_cache`(user_function)
`@functools.lru_cache`(maxsize=128, typed=False)
一个为函数提供缓存功能的装饰器,缓存 maxsize 组传入参数,在下次以相同参数调用时直接返回上一次的结果。用以节约高开销或I/O函数的调用时间。
由于使用了字典存储缓存,所以该函数的固定参数和关键字参数必须是可哈希的。
不同模式的参数可能被视为不同从而产生多个缓存项,例如, f(a=1, b=2) 和 f(b=2, a=1) 因其参数顺序不同,可能会被缓存两次。
如果指定了 user_function,它必须是一个可调用对象。 这允许 lru_cache 装饰器被直接应用于一个用户自定义函数,让 maxsize 保持其默认值 128:
1
2
3
4
def count_vowels(sentence):
sentence = sentence.casefold()
return sum(sentence.count(vowel) for vowel in 'aeiou')如果 maxsize 设置为
None
,LRU功能将被禁用且缓存数量无上限。 maxsize 设置为2的幂时可获得最佳性能。如果 typed 设置为true,不同类型的函数参数将被分别缓存。例如,
f(3)
和f(3.0)
将被视为不同而分别缓存。为了衡量缓存的有效性以便调整 maxsize 形参,被装饰的函数带有一个
cache_info()
函数。当调用cache_info()
函数时,返回一个具名元组,包含命中次数 hits,未命中次数 misses ,最大缓存数量 maxsize 和 当前缓存大小 currsize。在多线程环境中,命中数与未命中数是不完全准确的。该装饰器也提供了一个用于清理/使缓存失效的函数
cache_clear()
。原始的未经装饰的函数可以通过
__wrapped__
属性访问。它可以用于检查、绕过缓存,或使用不同的缓存再次装饰原始函数。“最久未使用算法”(LRU)缓存 在“最近的调用是即将到来的调用的最佳预测因子”时性能最好(比如,新闻服务器上最受欢迎的文章倾向于每天更改)。 “缓存大小限制”参数保证缓存不会在长时间运行的进程比如说网站服务器上无限制的增加自身的大小。
一般来说,LRU缓存只在当你想要重用之前计算的结果时使用。因此,用它缓存具有副作用的函数、需要在每次调用时创建不同、易变的对象的函数或者诸如time()或random()之类的不纯函数是没有意义的。
静态 Web 内容的 LRU 缓存示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def get_pep(num):
'Retrieve text of a Python Enhancement Proposal'
resource = 'http://www.python.org/dev/peps/pep-%04d/' % num
try:
with urllib.request.urlopen(resource) as s:
return s.read()
except urllib.error.HTTPError:
return 'Not Found'
for n in 8, 290, 308, 320, 8, 218, 320, 279, 289, 320, 9991:
pep = get_pep(n)
print(n, len(pep))
get_pep.cache_info()
CacheInfo(hits=3, misses=8, maxsize=32, currsize=8)1
2
3
4
5
6
7
8
9
10
11
def fib(n):
if n < 2:
return n
return fib(n-1) + fib(n-2)
for n in range(16)] [fib(n)
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610]
fib.cache_info()
CacheInfo(hits=28, misses=16, maxsize=None, currsize=16)在 3.3 版更改: 添加 typed 选项。
在 3.8 版更改: 添加了 user_function 选项。
`@functools.total_ordering`
给定一个声明一个或多个全比较排序方法的类,这个类装饰器实现剩余的方法。这减轻了指定所有可能的全比较操作的工作。
此类必须包含以下方法之一:
__lt__()
、__le__()
、__gt__()
或__ge__()
。另外,此类必须支持__eq__()
方法。例如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
class Student:
def _is_valid_operand(self, other):
return (hasattr(other, "lastname") and
hasattr(other, "firstname"))
def __eq__(self, other):
if not self._is_valid_operand(other):
return NotImplemented
return ((self.lastname.lower(), self.firstname.lower()) ==
(other.lastname.lower(), other.firstname.lower()))
def __lt__(self, other):
if not self._is_valid_operand(other):
return NotImplemented
return ((self.lastname.lower(), self.firstname.lower()) <
(other.lastname.lower(), other.firstname.lower()))虽然此装饰器使得创建具有良好行为的完全有序类型变得非常容易,但它 确实 是以执行速度更缓慢和派生比较方法的堆栈回溯更复杂为代价的。 如果性能基准测试表明这是特定应用的瓶颈所在,则改为实现全部六个富比较方法应该会轻松提升速度。
在 3.4 版更改: 现在已支持从未识别类型的下层比较函数返回 NotImplemented 异常。
functools.partial
(func, /, args, keywords*)返回一个新的 部分对象,当被调用时其行为类似于 func 附带位置参数 args 和关键字参数 keywords 被调用。 如果为调用提供了更多的参数,它们会被附加到 args。 如果提供了额外的关键字参数,它们会扩展并重载 keywords。 大致等价于:
1
2
3
4
5
6
7
8def partial(func, /, *args, **keywords):
def newfunc(*fargs, **fkeywords):
newkeywords = {**keywords, **fkeywords}
return func(*args, *fargs, **newkeywords)
newfunc.func = func
newfunc.args = args
newfunc.keywords = keywords
return newfuncpartial()
会被“冻结了”一部分函数参数和/或关键字的部分函数应用所使用,从而得到一个具有简化签名的新对象。 例如,partial()
可用来创建一个行为类似于int()
函数的可调用对象,其中 base 参数默认为二:1
2
3
4
5from functools import partial
2) basetwo = partial(int, base=
'Convert base 2 string to an int.' basetwo.__doc__ =
'10010') basetwo(
18class
functools.partialmethod
(func, /, args, keywords*)返回一个新的
partialmethod
描述器,其行为类似partial
但它被设计用作方法定义而非直接用作可调用对象。func 必须是一个 descriptor 或可调用对象(同属两者的对象例如普通函数会被当作描述器来处理)。
当 func 是一个描述器(例如普通 Python 函数,
classmethod()
,staticmethod()
,abstractmethod()
或其他partialmethod
的实例)时, 对__get__
的调用会被委托给底层的描述器,并会返回一个适当的 部分对象 作为结果。当 func 是一个非描述器类可调用对象时,则会动态创建一个适当的绑定方法。 当用作方法时其行为类似普通 Python 函数:将会插入 self 参数作为第一个位置参数,其位置甚至会处于提供给
partialmethod
构造器的 args 和 keywords 之前。示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17class Cell(object):
def __init__(self):
False self._alive =
@property
def alive(self):
return self._alive
def set_state(self, state):
self._alive = bool(state)
True) set_alive = partialmethod(set_state,
False) set_dead = partialmethod(set_state,
...
c = Cell()
c.alive
False
c.set_alive()
c.alive
Truefunctools.reduce
(function, iterable[, initializer])将两个参数的 function 从左至右积累地应用到 iterable 的条目,以便将该可迭代对象缩减为单一的值。 例如,
reduce(lambda x, y: x+y, [1, 2, 3, 4, 5])
是计算((((1+2)+3)+4)+5)
的值。 左边的参数 x 是积累值而右边的参数 y 则是来自 iterable 的更新值。 如果存在可选项 initializer,它会被放在参与计算的可迭代对象的条目之前,并在可迭代对象为空时作为默认值。 如果没有给出 initializer 并且 iterable 仅包含一个条目,则将返回第一项。大致相当于:
1
2
3
4
5
6
7
8
9def reduce(function, iterable, initializer=None):
it = iter(iterable)
if initializer is None:
value = next(it)
else:
value = initializer
for element in it:
value = function(value, element)
return value请参阅
itertools.accumulate()
了解有关可产生所有中间值的迭代器。-
将一个函数转换为 单分派 generic function。
要定义一个泛型函数,应使用
@singledispatch
装饰器进行装饰。 请注意分派是作用于第一个参数的类型,要相应地创建你的函数:>>>
1
2
3
4
5
6from functools import singledispatch
@singledispatch
def fun(arg, verbose=False):
if verbose:
"Let me just say,", end=" ") print(
print(arg)要将重载的实现添加到函数中,请使用泛型函数的
register()
属性。 它是一个装饰器。 对于带有类型标注的函数,该装饰器将自动推断第一个参数的类型:>>>
1
2
3
4
5
6
7
8
9
10
11
12@fun.register
def _(arg: int, verbose=False):
if verbose:
"Strength in numbers, eh?", end=" ") print(
print(arg)
...
@fun.register
def _(arg: list, verbose=False):
if verbose:
"Enumerate this:") print(
for i, elem in enumerate(arg):
print(i, elem)对于不使用类型标注的代码,可以将适当的类型参数显式地传给装饰器本身:
1
2
3
4
5
6@fun.register(complex)
def _(arg, verbose=False):
if verbose:
"Better than complicated.", end=" ") print(
print(arg.real, arg.imag)
...要启用注册 lambda 和现有函数,可以使用函数形式的
register()
属性:1
2
3
4def nothing(arg, verbose=False):
"Nothing.") print(
...
None), nothing) fun.register(type(register()
属性将返回启用了装饰器堆栈、封存的未装饰函数,并会为每个变量单独创建单元测试:1
2
3
4
5
6
7
8
9@fun.register(float)
@fun.register(Decimal)
def fun_num(arg, verbose=False):
if verbose:
"Half of your number:", end=" ") print(
2) print(arg /
...
is fun fun_num
False在调用时,泛型函数会根据第一个参数的类型进行分派:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16"Hello, world.") fun(
Hello, world.
"test.", verbose=True) fun(
Let me just say, test.
42, verbose=True) fun(
Strength in numbers, eh? 42
'spam', 'spam', 'eggs', 'spam'], verbose=True) fun([
Enumerate this:
0 spam
1 spam
2 eggs
3 spam
None) fun(
Nothing.
1.23) fun(
0.615在没有用于特定类型的已注册实现的情况下,则会使用其方法解析顺序来查找更通用的实现。 以
@singledispatch
装饰的原始函数将为最基本的object
类型进行注册,这意味着它将在找不到更好的实现时被使用。要检查泛型函数将为给定类型选择哪个实现,请使用
dispatch()
属性:1
2
3
4fun.dispatch(float)
<function fun_num at 0x1035a2840>
# note: default implementation fun.dispatch(dict)
<function fun at 0x103fe0000>要访问所有忆注册实现,请使用只读的
registry
属性:1
2
3
4
5
6
7
8fun.registry.keys()
dict_keys([<class 'NoneType'>, <class 'int'>, <class 'object'>,
<class 'decimal.Decimal'>, <class 'list'>,
<class 'float'>])
>>> fun.registry[float]
<function fun_num at 0x1035a2840>
>>> fun.registry[object]
<function fun at 0x103fe0000>在 3.7 版更改:
register()
属性支持使用类型标注。 class
functools.singledispatchmethod
(func)将一个方法转换为 单分派 generic function。
要定义一个泛型方法,应使用
@singledispatchmethod
装饰器进行装饰。 请注意分派是作用于第一个非 self 或非 cls 参数的类型,要相应地创建你的函数:1
2
3
4
5
6
7
8
9
10
11
12class Negator:
def neg(self, arg):
raise NotImplementedError("Cannot negate a")
def _(self, arg: int):
return -arg
def _(self, arg: bool):
return not arg@singledispatchmethod
支持与其他装饰器如@classmethod
相嵌套。 请注意如果要允许dispatcher.register
,则singledispatchmethod
必须是 最外层 的装饰器。 下面的示例定义了Negator
类,其中包含绑定到类的neg
方法:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15class Negator:
def neg(cls, arg):
raise NotImplementedError("Cannot negate a")
def _(cls, arg: int):
return -arg
def _(cls, arg: bool):
return not arg同样的模式也被用于其他类似的装饰器:
staticmethod
,abstractmethod
等等。3.8 新版功能.
functools.update_wrapper
(wrapper, wrapped, assigned=WRAPPER_ASSIGNMENTS, updated=WRAPPER_UPDATES)更新一个 wrapper 函数以使其类似于 wrapped 函数。 可选参数为指明原函数的哪些属性要直接被赋值给 wrapper 函数的匹配属性的元组,并且这些 wrapper 函数的属性将使用原函数的对应属性来更新。 这些参数的默认值是模块级常量
WRAPPER_ASSIGNMENTS
(它将被赋值给 wrapper 函数的__module__
,__name__
,__qualname__
,__annotations__
和__doc__
即文档字符串) 以及WRAPPER_UPDATES
(它将更新 wrapper 函数的__dict__
即实例字典)。为了允许出于内省和其他目的访问原始函数(例如绕过
lru_cache()
之类的缓存装饰器),此函数会自动为 wrapper 添加一个指向被包装函数的__wrapped__
属性。此函数的主要目的是在 decorator 函数中用来包装被装饰的函数并返回包装器。 如果包装器函数未被更新,则被返回函数的元数据将反映包装器定义而不是原始函数定义,这通常没有什么用处。
update_wrapper()
可以与函数之外的可调用对象一同使用。 在 assigned 或 updated 中命名的任何属性如果不存在于被包装对象则会被忽略(即该函数将不会尝试在包装器函数上设置它们)。 如果包装器函数自身缺少在 updated 中命名的任何属性则仍将引发AttributeError
。3.2 新版功能: 自动添加
__wrapped__
属性。3.2 新版功能: 默认拷贝
__annotations__
属性。在 3.2 版更改: 不存在的属性将不再触发
AttributeError
。在 3.4 版更改:
__wrapped__
属性现在总是指向被包装的函数,即使该函数定义了__wrapped__
属性。 (参见 bpo-17482)wrapped是被装饰的原函数
wrapper是被装饰器装饰后的新函数。
补充例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14def outer(func):
def inner(*args, **kwargs):
print(f"before...")
func(*args, **kwargs)
print("after...")
return inner
def add(a, b):
"""
求和运算
"""
print(a + b)1、原函数为add。
2、@outer会去执行outer装饰器,传入add函数,返回一个inner函数。
3、执行outer函数时,加载inner函数,此时会直接执行functools.wraps(func)返回一个可调用对象,即partial对象。
4、此时inner的装饰器实际上是@partial,partial会被调用,传入inner函数,执行partial内部的update_wrapper函数,将func的相应属性拷贝给inner函数,最后返回inner函数。这一步并没有生成新的函数,仅仅是改变了inner函数的属性。
5、把add指向inner函数。
6、调用add实际调用的是inner函数,inner函数内部持有原add函数的引用即func。
update_wrapper函数参数对应:
wrapper指的是inner函数
wrapped指的是func即原始的add函数
`@functools.wraps`(wrapped, assigned=WRAPPER_ASSIGNMENTS, updated=WRAPPER_UPDATES)
这是一个便捷函数,用于在定义包装器函数时发起调用
update_wrapper()
作为函数装饰器。 它等价于partial(update_wrapper, wrapped=wrapped, assigned=assigned, updated=updated)
。 例如:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20from functools import wraps
def my_decorator(f):
@wraps(f)
def wrapper(*args, **kwds):
'Calling decorated function') print(
return f(*args, **kwds)
return wrapper
...
@my_decorator
def example():
"""Docstring"""
'Called example function') print(
...
example()
Calling decorated function
Called example function
example.__name__
'example'
example.__doc__
'Docstring'如果不使用这个装饰器工厂函数,则 example 函数的名称将变为
'wrapper'
,并且example()
原本的文档字符串将会丢失。
partial
对象
partial
对象是由 partial()
创建的可调用对象。 它们具有三个只读属性:
partial.func
partial.args
最左边的位置参数将放置在提供给
partial
对象调用的位置参数之前。partial.keywords
当调用
partial
对象时将要提供的关键字参数。
partial
对象与 function
对象的类似之处在于它们都是可调用、可弱引用的对象并可拥有属性。 但两者也存在一些重要的区别。 例如前者不会自动创建 __name__
和 __doc__
属性。 而且,在类中定义的 partial
对象的行为类似于静态方法,并且不会在实例属性查找期间转换为绑定方法。
小结
functools.wraps
目的消除装饰器对原函数造成的影响, 通过对原函数相关属性拷贝,已达到装饰器不修改原函数的目的。wraps内部通过partial对象和update_wrapper函数实现
partial是一个类,通过实现了双下方法new,自定义实例化对象过程,使得对象内部保留原函数和固定参数,通过实现双下方法call,使得对象可以像函数一样被调用,再通过内部保留的原函数和固定参数以及传入的其它参数进行原函数调用。