On this page
4. 更多控制流程工具
除了刚刚介绍的while语句外,Python 还使用了其他语言中已知的常规流控制语句,但有一些不同之处。
4.1. 如果 Statements
也许最著名的语句类型是if语句。例如:
>>> x = int(input("Please enter an integer: "))
Please enter an integer: 42
>>> if x < 0:
... x = 0
... print('Negative changed to zero')
... elif x == 0:
... print('Zero')
... elif x == 1:
... print('Single')
... else:
... print('More')
...
More
可以有零个或多个elif部分,而else部分是可选的。关键字“ elif
”是“ else if”的缩写,对于避免过度缩进很有用。 if
…elif
…elif
…序列替代了其他语言中的switch
或case
语句。
4.2. 语句
Python 中的for语句与您在 C 或 Pascal 中使用的语句有所不同。 Python 的for
语句不是对数字的算术级数进行迭代(例如在 Pascal 中),也不是让用户能够定义迭代步骤和暂停条件(如 C),而是对任何序列的项(列表或列表)进行迭代。字符串),按它们在序列中出现的 Sequences 排列。例如(无双关语):
>>> # Measure some strings:
... words = ['cat', 'window', 'defenestrate']
>>> for w in words:
... print(w, len(w))
...
cat 3
window 6
defenestrate 12
在迭代同一集合时修改集合的代码可能很难正确。取而代之的是,通常更直接地遍历集合的副本或创建新的集合:
# Strategy: Iterate over a copy
for user, status in users.copy().items():
if status == 'inactive':
del users[user]
# Strategy: Create a new collection
active_users = {}
for user, status in users.items():
if status == 'active':
active_users[user] = status
4.3. range()函数
如果确实需要遍历数字序列,则内置函数range()会派上用场。它生成算术级数:
>>> for i in range(5):
... print(i)
...
0
1
2
3
4
给定的 endpoints 永远不会成为所生成序列的一部分; range(10)
生成 10 个值,这是长度为 10 的序列的合法索引。可以使范围从另一个数字开始,也可以指定一个不同的增量(甚至是负数;甚至是负数;有时也称为“步长”):
range(5, 10)
5, 6, 7, 8, 9
range(0, 10, 3)
0, 3, 6, 9
range(-10, -100, -30)
-10, -40, -70
要遍历序列的索引,可以将range()和len()组合如下:
>>> a = ['Mary', 'had', 'a', 'little', 'lamb']
>>> for i in range(len(a)):
... print(i, a[i])
...
0 Mary
1 had
2 a
3 little
4 lamb
但是,在大多数此类情况下,使用enumerate()函数很方便,请参阅Looping Techniques。
如果仅打印范围,则会发生奇怪的事情:
>>> print(range(10))
range(0, 10)
range()返回的对象在许多方面的行为就像是一个列表,但实际上并非如此。它是一个对象,当您对其进行迭代时,它会返回所需序列的连续项,但它并没有 true 组成列表,从而节省了空间。
我们说这样的对象是iterable,即适合用作Function和构造的目标,这些Function和构造期望它们可以从中获取连续的物品,直到用完为止。我们已经看到for语句就是这样的构造,而带有可迭代函数的示例是sum():
>>> sum(range(4)) # 0 + 1 + 2 + 3
6
稍后我们将看到更多返回可迭代并将其作为参数的函数。最后,也许您对如何从范围中获取列表感到好奇。解决方法如下:
>>> list(range(4))
[0, 1, 2, 3]
在Data Structures章中,我们将更详细地讨论list()。
4.4. break 和 continue 语句, 以及在循环中的 else
像 C 中一样,break语句脱离了最里面的for或while循环。
循环语句可以包含else
子句;当循环pass穷尽迭代器(使用for)而终止时,或者当条件变为假(使用while)时,则执行此方法,但是当循环passbreak语句终止时则不执行。以下循环示例搜索质数:
>>> for n in range(2, 10):
... for x in range(2, n):
... if n % x == 0:
... print(n, 'equals', x, '*', n//x)
... break
... else:
... # loop fell through without finding a factor
... print(n, 'is a prime number')
...
2 is a prime number
3 is a prime number
4 equals 2 * 2
5 is a prime number
6 equals 2 * 3
7 is a prime number
8 equals 2 * 4
9 equals 3 * 3
(是的,这是正确的代码.仔细观察:else
子句属于for循环,而不是if语句。)
与循环一起使用时,else
子句与try语句的else
子句相比,与if语句具有更多的共同点:try语句的else
子句在没有异常发生时运行,而循环的else
子句在没有break
时运行。发生。有关try
语句和异常的更多信息,请参见Handling Exceptions。
continue语句(也是从 C 借用的)continue 循环的下一个迭代:
>>> for num in range(2, 10):
... if num % 2 == 0:
... print("Found an even number", num)
... continue
... print("Found a number", num)
Found an even number 2
Found a number 3
Found an even number 4
Found a number 5
Found an even number 6
Found a number 7
Found an even number 8
Found a number 9
4.5. pass 语句
pass语句不执行任何操作。当在语法上需要一条语句但该程序不需要任何操作时,可以使用它。例如:
>>> while True:
... pass # Busy-wait for keyboard interrupt (Ctrl+C)
...
这通常用于创建最少的类:
>>> class MyEmptyClass:
... pass
...
在编写新代码时,可以使用另一个位置pass作为函数或条件主体的占位符,从而使您可以 continue 进行更抽象的思考。 pass
被静默忽略:
>>> def initlog(*args):
... pass # Remember to implement this!
...
4.6. 定义Function
我们可以创建一个将斐波那契数列写入任意边界的函数:
>>> def fib(n): # write Fibonacci series up to n
... """Print a Fibonacci series up to n."""
... a, b = 0, 1
... while a < n:
... print(a, end=' ')
... a, b = b, a+b
... print()
...
>>> # Now call the function we just defined:
... fib(2000)
0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597
关键字def引入了* definition *函数。它后面必须是函数名称和形式参数的括号列表。构成函数主体的语句从下一行开始,并且必须缩进。
函数主体的第一条语句可以选择是字符串 Literals;此字符串 Literals 是函数的文档字符串或* docstring *。 (有关文档字符串的更多信息,请参见Documentation Strings部分。)有些工具使用文档字符串自动生成在线或打印文档,或者使用户以交互方式浏览代码。最好在您编写的代码中包含文档字符串,因此请养成习惯。
函数的“执行”引入了一个新的符号表,用于该函数的局部变量。更准确地说,函数中的所有变量分配都将值存储在本地符号表中。而变量引用首先在本地符号表中查找,然后在封闭函数的本地符号表中查找,然后在全局符号表中查找,最后在内置名称表中查找。因此,全局变量和封闭函数的变量不能直接分配给函数内的值(除非对于全局变量,在global语句中命名,或者对于封闭函数的变量,在nonlocal语句中命名),尽管它们可能是参考。
函数调用的实际参数(参数)在被调用时被引入到被调用函数的本地符号表中。因此,参数是pass“按值调用”(其中“值”始终是对象“引用”而不是对象的值)传递的。 [1]当一个函数调用另一个函数时,将为该调用创建一个新的本地符号表。
函数定义将函数名称与当前符号表中的函数对象相关联。解释器将由该名称指向的对象识别为用户定义的函数。其他名称也可以指向同一Function对象,也可以用于访问该Function:
>>> fib
<function fib at 10042ed0>
>>> f = fib
>>> f(100)
0 1 1 2 3 5 8 13 21 34 55 89
来自其他语言的您可能会反对fib
不是函数而是过程,因为它不返回值。实际上,即使没有return语句的函数也确实会返回一个值,尽管这很无聊。此值称为None
(这是内置名称)。如果写入值None
是唯一写入的值,通常会被解释器抑制。如果您确实要使用print(),则可以看到它:
>>> fib(0)
>>> print(fib(0))
None
编写一个返回斐波那契数列编号列表的函数很简单,而不是打印它:
>>> def fib2(n): # return Fibonacci series up to n
... """Return a list containing the Fibonacci series up to n."""
... result = []
... a, b = 0, 1
... while a < n:
... result.append(a) # see below
... a, b = b, a+b
... return result
...
>>> f100 = fib2(100) # call it
>>> f100 # write the result
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
像往常一样,此示例演示了一些 Python 新Function:
return语句返回一个函数值。没有表达式参数的
return
返回None
。从函数末尾掉落也会返回None
。语句
result.append(a)
调用列表对象result
的方法。方法是一种“属于”对象的函数,名为obj.methodname
,其中obj
是某个对象(可能是表达式),而methodname
是由对象的类型定义的方法的名称。不同的类型定义不同的方法。不同类型的方法可以使用相同的名称而不会引起歧义。 (可以使用* classes *定义自己的对象类型和方法,请参见Classes)。示例中显示的方法append()
是为列表对象定义的;它在列表的末尾添加了一个新元素。在此示例中,它等效于result = result + [a]
,但效率更高。
4.7. 有关定义函数的更多信息
也可以使用可变数量的参数定义函数。有三种形式可以组合。
4.7.1. 默认参数值
最有用的形式是为一个或多个参数指定默认值。这将创建一个函数,该函数可以使用比其定义所允许的参数更少的参数来调用。例如:
def ask_ok(prompt, retries=4, reminder='Please try again!'):
while True:
ok = input(prompt)
if ok in ('y', 'ye', 'yes'):
return True
if ok in ('n', 'no', 'nop', 'nope'):
return False
retries = retries - 1
if retries < 0:
raise ValueError('invalid user response')
print(reminder)
可以pass几种方式调用此函数:
仅给出强制性参数:
ask_ok('Do you really want to quit?')
提供可选参数之一:
ask_ok('OK to overwrite the file?', 2)
甚至提供所有参数:
ask_ok('OK to overwrite the file?', 2, 'Come on, only yes or no!')
此示例还介绍了in关键字。这将测试序列是否包含某个值。
默认值在* defining *范围内的函数定义点进行评估,因此
i = 5
def f(arg=i):
print(arg)
i = 6
f()
将打印5
。
重要警告: 默认值仅被评估一次。当默认值是可变对象(例如列表,字典或大多数类的实例)时,这会有所不同。例如,以下函数累积在后续调用中传递给它的参数:
def f(a, L=[]):
L.append(a)
return L
print(f(1))
print(f(2))
print(f(3))
这将打印
[1]
[1, 2]
[1, 2, 3]
如果您不希望在后续调用之间共享默认值,则可以这样编写函数:
def f(a, L=None):
if L is None:
L = []
L.append(a)
return L
4.7.2. 关键字参数
也可以使用kwarg=value
形式的keyword arguments调用函数。例如,以下Function:
def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'):
print("-- This parrot wouldn't", action, end=' ')
print("if you put", voltage, "volts through it.")
print("-- Lovely plumage, the", type)
print("-- It's", state, "!")
接受一个必需的参数(voltage
)和三个可选参数(state
,action
和type
)。可以pass以下任意一种方式调用此函数:
parrot(1000) # 1 positional argument
parrot(voltage=1000) # 1 keyword argument
parrot(voltage=1000000, action='VOOOOOM') # 2 keyword arguments
parrot(action='VOOOOOM', voltage=1000000) # 2 keyword arguments
parrot('a million', 'bereft of life', 'jump') # 3 positional arguments
parrot('a thousand', state='pushing up the daisies') # 1 positional, 1 keyword
但以下所有调用均无效:
parrot() # required argument missing
parrot(voltage=5.0, 'dead') # non-keyword argument after a keyword argument
parrot(110, voltage=220) # duplicate value for the same argument
parrot(actor='John Cleese') # unknown keyword argument
在函数调用中,关键字参数必须位于位置参数之后。传递的所有关键字参数都必须与函数接受的参数之一匹配(例如actor
不是parrot
函数的有效参数),并且它们的 Sequences 并不重要。这也包括非可选参数(例如parrot(voltage=1000)
也是有效的)。任何参数都不能多次收到一个值。由于此限制,以下示例失败:
>>> def function(a):
... pass
...
>>> function(0, a=0)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: function() got multiple values for keyword argument 'a'
当存在形式为**name
的finally形式参数时,它将接收一个词典(请参见Map 类型— dict),该词典包含除与形式参数相对应的所有关键词参数之外的所有关键词参数。可以将其与形式为*name
的形式参数结合(在下一个小节中进行描述),形式参数tuple包含形式参数之外的位置参数。 (*name
必须出现在**name
之前.)例如,如果我们定义如下函数:
def cheeseshop(kind, *arguments, **keywords):
print("-- Do you have any", kind, "?")
print("-- I'm sorry, we're all out of", kind)
for arg in arguments:
print(arg)
print("-" * 40)
for kw in keywords:
print(kw, ":", keywords[kw])
可以这样称呼:
cheeseshop("Limburger", "It's very runny, sir.",
"It's really very, VERY runny, sir.",
shopkeeper="Michael Palin",
client="John Cleese",
sketch="Cheese Shop Sketch")
当然会打印:
-- Do you have any Limburger ?
-- I'm sorry, we're all out of Limburger
It's very runny, sir.
It's really very, VERY runny, sir.
----------------------------------------
shopkeeper : Michael Palin
client : John Cleese
sketch : Cheese Shop Sketch
请注意,关键字参数的打印 Sequences 保证与在函数调用中提供它们的 Sequences 匹配。
4.7.3. 特殊参数
默认情况下,参数可以按位置或pass关键字显式传递给 Python 函数。为了提高可读性和性能,限制参数传递的方式是有意义的,以便开发人员仅需查看函数定义即可确定是按位置,按位置或关键字还是按关键字传递项目。
函数定义可能类似于:
def f(pos1, pos2, /, pos_or_kwd, *, kwd1, kwd2):
----------- ---------- ----------
| | |
| Positional or keyword |
| - Keyword only
-- Positional only
其中/
和*
是可选的。如果使用这些符号,则它们pass将参数传递给函数的方式指示参数的类型:仅位置,仅位置关键字或仅关键字。关键字参数也称为命名参数。
4.7.3.1. 位置或关键字参数
如果函数定义中不存在/
和*
,则可以按位置或关键字将参数传递给函数。
4.7.3.2. 仅位置参数
更详细地看待这一点,可以将某些参数标记为仅位置。如果* positional-only *,则参数的 Sequences 很重要,并且不能pass关键字传递参数。仅位置参数放置在/
(正斜杠)之前。 /
用于在逻辑上将仅位置参数与其余参数分开。如果函数定义中没有/
,则没有仅位置参数。
/
之后的参数可以是* position-or-keyword 或 keyword-only *。
4.7.3.3. 仅关键字参数
要将参数标记为* keyword-only ,以指示参数必须pass关键字参数传递,请将*
放在参数列表中的第一个 keyword-only *参数之前。
4.7.3.4. Function实例
考虑以下示例函数定义,请密切注意标记/
和*
:
>>> def standard_arg(arg):
... print(arg)
...
>>> def pos_only_arg(arg, /):
... print(arg)
...
>>> def kwd_only_arg(*, arg):
... print(arg)
...
>>> def combined_example(pos_only, /, standard, *, kwd_only):
... print(pos_only, standard, kwd_only)
第一个函数定义standard_arg
是最熟悉的形式,它对调用约定没有任何限制,并且可以pass位置或关键字来传递参数:
>>> standard_arg(2)
2
>>> standard_arg(arg=2)
2
第二个函数pos_only_arg
被限制为仅使用位置参数,因为函数定义中有/
:
>>> pos_only_arg(1)
1
>>> pos_only_arg(arg=1)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: pos_only_arg() got an unexpected keyword argument 'arg'
第三个函数kwd_only_args
仅允许关键字参数,如函数定义中的*
所示:
>>> kwd_only_arg(3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: kwd_only_arg() takes 0 positional arguments but 1 was given
>>> kwd_only_arg(arg=3)
3
最后一个在相同的函数定义中使用所有三个调用约定:
>>> combined_example(1, 2, 3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: combined_example() takes 2 positional arguments but 3 were given
>>> combined_example(1, 2, kwd_only=3)
1 2 3
>>> combined_example(1, standard=2, kwd_only=3)
1 2 3
>>> combined_example(pos_only=1, standard=2, kwd_only=3)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: combined_example() got an unexpected keyword argument 'pos_only'
最后,考虑以下函数定义,该定义在位置参数name
和以name
作为键的**kwds
之间可能发生冲突:
def foo(name, **kwds):
return 'name' in kwds
没有可能的调用使它返回True
,因为关键字'name'
将始终绑定到第一个参数。例如:
>>> foo(1, **{'name': 2})
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: foo() got multiple values for argument 'name'
>>>
但是使用/
(仅位置参数)是可能的,因为它允许name
作为位置参数,而'name'
作为关键字参数中的键:
def foo(name, /, **kwds):
return 'name' in kwds
>>> foo(1, **{'name': 2})
True
换句话说,仅位置参数的名称可以在**kwds
中使用而没有歧义。
4.7.3.5. Recap
用例将确定在函数定义中使用哪些参数:
def f(pos1, pos2, /, pos_or_kwd, *, kwd1, kwd2):
As guidance:
如果您不希望用户使用参数名称,请使用仅位置。当参数名称没有实际含义时,如果要在调用函数时强制执行参数的 Sequences,或者需要使用一些位置参数和任意关键字,此Function将非常有用。
仅当名称具有含义且pass使用名称显式使函数定义更容易理解时,或要防止用户依赖传递的参数的位置时,才应使用关键字。
对于 API,如果将来要修改参数的名称,请仅使用 positional 以防止破坏 API 更改。
4.7.4. 任意参数列表
最后,最不常用的选项是指定可以使用任意数量的参数调用函数。这些参数将包装在一个 Tuples 中(请参见Tuples 和序列)。在可变数量的参数之前,可能会出现零个或多个常规参数。
def write_multiple_items(file, separator, *args):
file.write(separator.join(args))
通常,这些variadic
参数将在形式参数列表中排在最后,因为它们会获取传递给函数的所有其余 Importing 参数。出现在*args
参数之后的任何形式参数都是“仅关键字”参数,这意味着它们只能用作关键字,而不能用作位置参数。
>>> def concat(*args, sep="/"):
... return sep.join(args)
...
>>> concat("earth", "mars", "venus")
'earth/mars/venus'
>>> concat("earth", "mars", "venus", sep=".")
'earth.mars.venus'
4.7.5. 解包参数列表
当参数已经在列表或 Tuples 中,但需要为需要单独的位置参数的函数调用拆包时,则发生相反的情况。例如,内置的range()函数需要单独的* start 和 stop *参数。如果不能单独使用它们,请使用*
-operator 编写函数调用,以将参数从列表或 Tuples 中解包:
>>> list(range(3, 6)) # normal call with separate arguments
[3, 4, 5]
>>> args = [3, 6]
>>> list(range(*args)) # call with arguments unpacked from a list
[3, 4, 5]
字典可以用相同的方式pass**
-operator 传递关键字参数:
>>> def parrot(voltage, state='a stiff', action='voom'):
... print("-- This parrot wouldn't", action, end=' ')
... print("if you put", voltage, "volts through it.", end=' ')
... print("E's", state, "!")
...
>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
>>> parrot(**d)
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !
4.7.6. Lambda 表达式
小型匿名函数可以使用lambda关键字创建。此函数返回其两个参数的总和:lambda a, b: a+b
。 Lambda 函数可在需要函数对象的任何地方使用。在语法上将它们限制为单个表达式。从语义上讲,它们只是正常Function定义的语法糖。像嵌套函数定义一样,lambda 函数可以引用包含范围中的变量:
>>> def make_incrementor(n):
... return lambda x: x + n
...
>>> f = make_incrementor(42)
>>> f(0)
42
>>> f(1)
43
上面的示例使用 lambda 表达式返回函数。另一个用途是传递一个小的函数作为参数:
>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]
>>> pairs.sort(key=lambda pair: pair[1])
>>> pairs
[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]
4.7.7. 文档字符串
以下是有关文档字符串的内容和格式的一些约定。
第一行应始终是对象用途的简短摘要。为简便起见,它不应明确语句对象的名称或类型,因为可以pass其他方式使用它们(除非名称恰好是描述函数操作的动词)。该行应以大写字母开头,以句点结尾。
如果文档字符串中还有更多行,则第二行应为空白,以可视方式将摘要与描述的其余部分分开。以下几行应为一个或多个段落,描述对象的调用约定,其副作用等。
Python 解析器不会从 Python 中的多行字符串 Literals 中去除缩进,因此,如果需要,处理文档的工具必须去除缩进。使用以下约定完成此操作。字符串的第一行之后的第一行非空白行确定整个文档字符串的缩进量。 (我们不能使用第一行,因为它通常与字符串的开头引号相邻,因此其缩进在字符串 Literals 中不明显.)然后,从字符串的所有行的开头去除与该缩进“等效”的空格。缩进较少的行不应发生,但如果发生缩进,则应删除所有前导空格。制表符展开后(通常为 8 个空格),应测试空格的等效性。
这是一个多行文档字符串的示例:
>>> def my_function():
... """Do nothing, but document it.
...
... No, really, it doesn't do anything.
... """
... pass
...
>>> print(my_function.__doc__)
Do nothing, but document it.
No, really, it doesn't do anything.
4.7.8. Function Comments
Function annotations是有关用户定义函数使用的类型的完全可选的元数据信息(有关更多信息,请参见 PEP 3107和 PEP 484)。
Annotations作为字典存储在函数的__annotations__
属性中,对函数的任何其他部分均没有影响。参数 Comments 由参数名称后的冒号定义,后跟一个评估 Comments 值的表达式。返回 Comments 由 Literals->
定义,后跟一个表达式,在参数列表和表示def语句结尾的冒号之间。以下示例具有位置参数,关键字参数和带 Comments 的返回值:
>>> def f(ham: str, eggs: str = 'eggs') -> str:
... print("Annotations:", f.__annotations__)
... print("Arguments:", ham, eggs)
... return ham + ' and ' + eggs
...
>>> f('spam')
Annotations: {'ham': <class 'str'>, 'return': <class 'str'>, 'eggs': <class 'str'>}
Arguments: spam eggs
'spam and eggs'
4.8. 间奏曲:编码样式
现在您将要编写更长,更复杂的 Python,现在是讨论编码样式的好时机。多数语言可以用不同的风格来写(或更简洁,格式化)。有些比其他更具可读性。使他人易于阅读您的代码始终是一个好主意,采用良好的编码风格对此有很大帮助。
对于 Python,大多数项目都遵循 PEP 8作为样式指南。它促进了一种非常易读且令人赏心悦目的编码风格。每个 Python 开发人员都应该在某个时候阅读它。以下是为您提取的最重要的要点:
- 使用 4 空格缩进,并且没有制表符。
4 空格是小压痕(允许更大的嵌套深度)和大压痕(易于阅读)之间的良好折衷。标签会引起混淆,最好不要使用。
- 换行,使它们不超过 79 个字符。
这有助于小尺寸显示器的用户,并可以在大尺寸显示器上并排放置多个代码文件。
使用空行分隔函数和类,并在函数内部使用较大的代码块。
如有可能,将 Comments 放在自己的一行上。
Use docstrings.
在运算符周围和逗号后使用空格,但不要在括号结构
a = f(1, 2) + g(3, 4)
中直接使用。一致地命名您的类和函数;约定是对类使用
UpperCamelCase
,对函数和方法使用lowercase_with_underscores
。始终使用self
作为第一个方法参数的名称(有关类和方法的更多信息,请参见初识类)。如果您的代码打算在国际环境中使用,请不要使用奇特的编码。在任何情况下,Python 的默认值,UTF-8 或纯 ASCII 效果最佳。
同样,如果说不同语言的人阅读或维护代码的可能性很小,请不要在标识符中使用非 ASCII 字符。
Footnotes
- [1]
- 实际上,“按对象引用调用”将是一个更好的描述,因为如果传递了可变对象,则调用者将看到被调用者对其进行的任何更改(将项目插入列表)。