4. 更多控制流程工具

除了刚刚介绍的while语句外,Python 还使用了其他语言中已知的常规流控制语句,但有一些不同之处。

4.1. 如果 Statements

也许最著名的语句类型是if语句。例如:

>>> x = int(raw_input("Please enter an integer: "))
Please enter an integer: 42
>>> if x < 0:
...     x = 0
...     print 'Negative changed to zero'
... elif x == 0:
...     print 'Zero'
... elif x == 1:
...     print 'Single'
... else:
...     print 'More'
...
More

可以有零个或多个elif部分,而else部分是可选的。关键字“ elif”是“ else if”的缩写,对于避免过度缩进很有用。 ifelifelif…序列代替了其他语言中的switchcase语句。

4.2. 语句

Python 中的for语句与您在 C 或 Pascal 中使用的语句有所不同。 Python 的for语句不是对数字的算术级数进行迭代(例如在 Pascal 中),也不是让用户能够定义迭代步骤和暂停条件(如 C),而是对任何序列的项(列表或列表)进行迭代。字符串),按它们在序列中出现的 Sequences 排列。例如(无双关语):

>>> # Measure some strings:
... words = ['cat', 'window', 'defenestrate']
>>> for w in words:
...     print w, len(w)
...
cat 3
window 6
defenestrate 12

如果需要修改循环中要迭代的序列(例如,复制选定的项目),建议您首先进行复制。遍历序列不会隐式地创建副本。切片符号使这一点特别方便:

>>> for w in words[:]:  # Loop over a slice copy of the entire list.
...     if len(w) > 6:
...         words.insert(0, w)
...
>>> words
['defenestrate', 'cat', 'window', 'defenestrate']

4.3. range()函数

如果确实需要遍历数字序列,则内置函数range()会派上用场。它生成包含算术级数的列表:

>>> range(10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

给定的 endpoints 永远不会成为生成列表的一部分; range(10)生成 10 个值的列表,这些值是长度为 10 的序列的项目的合法索引。可以使范围从另一个数字开始,也可以指定一个不同的增量(甚至是负数;甚至可以是负数;有时也称为“步骤” ):

>>> range(5, 10)
[5, 6, 7, 8, 9]
>>> range(0, 10, 3)
[0, 3, 6, 9]
>>> range(-10, -100, -30)
[-10, -40, -70]

要遍历序列的索引,可以将range()len()组合如下:

>>> a = ['Mary', 'had', 'a', 'little', 'lamb']
>>> for i in range(len(a)):
...     print i, a[i]
...
0 Mary
1 had
2 a
3 little
4 lamb

但是,在大多数此类情况下,使用enumerate()函数很方便,请参阅Looping Techniques

4.4. break 和 continue 语句, 以及在循环中的 else

像 C 中一样,break语句脱离了最里面的forwhile循环。

循环语句可以包含else子句;当循环pass用尽列表(用__)终止循环或当条件变为假(用while)终止时执行,但在用break语句终止循环时不执行。以下循环示例搜索质数:

>>> for n in range(2, 10):
...     for x in range(2, n):
...         if n % x == 0:
...             print n, 'equals', x, '*', n/x
...             break
...     else:
...         # loop fell through without finding a factor
...         print n, 'is a prime number'
...
2 is a prime number
3 is a prime number
4 equals 2 * 2
5 is a prime number
6 equals 2 * 3
7 is a prime number
8 equals 2 * 4
9 equals 3 * 3

(是的,这是正确的代码.仔细观察:else子句属于for循环, 不是 if语句。)

与循环一起使用时,else子句与try语句的else子句比if语句具有更多的共同点:try语句的else子句在没有异常发生时运行,而循环的else子句在没有break发生时运行。 。有关try语句和异常的更多信息,请参见Handling Exceptions

continue语句(也是从 C 借用的)continue 循环的下一个迭代:

>>> for num in range(2, 10):
...     if num % 2 == 0:
...         print "Found an even number", num
...         continue
...     print "Found a number", num
Found an even number 2
Found a number 3
Found an even number 4
Found a number 5
Found an even number 6
Found a number 7
Found an even number 8
Found a number 9

4.5. pass 语句

pass语句不执行任何操作。当在语法上需要一条语句但该程序不需要任何操作时,可以使用它。例如:

>>> while True:
...     pass  # Busy-wait for keyboard interrupt (Ctrl+C)
...

这通常用于创建最少的类:

>>> class MyEmptyClass:
...     pass
...

编写新代码时,可以使用另一个位置pass作为函数或条件主体的占位符,从而使您可以 continue 进行更抽象的思考。 pass被静默忽略:

>>> def initlog(*args):
...     pass   # Remember to implement this!
...

4.6. 定义Function

我们可以创建一个将斐波那契数列写入任意边界的函数:

>>> def fib(n):    # write Fibonacci series up to n
...     """Print a Fibonacci series up to n."""
...     a, b = 0, 1
...     while a < n:
...         print a,
...         a, b = b, a+b
...
>>> # Now call the function we just defined:
... fib(2000)
0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987 1597

关键字def引入了* definition *函数。它后面必须是函数名称和形式参数的括号列表。构成函数主体的语句从下一行开始,并且必须缩进。

函数主体的第一条语句可以选择是字符串 Literals;此字符串 Literals 是函数的文档字符串或* docstring *。 (有关文档字符串的更多信息,请参见Documentation Strings部分。)有些工具使用文档字符串自动生成在线或打印文档,或让用户以交互方式浏览代码。最好在您编写的代码中包含文档字符串,因此请养成习惯。

函数的“执行”引入了一个新的符号表,用于该函数的局部变量。更准确地说,函数中的所有变量分配都将值存储在本地符号表中。而变量引用首先在本地符号表中查找,然后在封闭函数的本地符号表中查找,然后在全局符号表中查找,最后在内置名称表中查找。因此,尽管可以引用全局变量,但是不能直接在函数内为其分配值(除非在global语句中命名)。

函数调用的实际参数(参数)在被调用时被引入到被调用函数的本地符号表中。因此,参数是pass“按值调用”(其中“值”始终是对象“引用”而不是对象的值)传递的。 [1]当一个函数调用另一个函数时,将为该调用创建一个新的本地符号表。

函数定义在当前符号表中引入函数名称。函数名称的值具有一种类型,该类型可以被解释器识别为用户定义的函数。可以将该值分配给另一个名称,该名称也可以用作Function。这用作一般的重命名机制:

>>> fib
<function fib at 10042ed0>
>>> f = fib
>>> f(100)
0 1 1 2 3 5 8 13 21 34 55 89

来自其他语言的您可能会反对fib不是函数而是过程,因为它不返回值。实际上,即使没有return语句的函数也确实会返回一个值,尽管这很无聊。此值称为None(这是内置名称)。如果写入值None是唯一写入的值,通常会被解释器抑制。如果您确实要使用print,则可以看到它:

>>> fib(0)
>>> print fib(0)
None

编写一个返回斐波那契数列编号列表的函数很简单,而不是打印它:

>>> def fib2(n):  # return Fibonacci series up to n
...     """Return a list containing the Fibonacci series up to n."""
...     result = []
...     a, b = 0, 1
...     while a < n:
...         result.append(a)    # see below
...         a, b = b, a+b
...     return result
...
>>> f100 = fib2(100)    # call it
>>> f100                # write the result
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]

像往常一样,此示例演示了一些 Python 新Function:

  • return语句返回一个函数值。没有表达式参数的return返回None。从函数末尾掉落也会返回None

  • 语句result.append(a)调用列表对象result方法。方法是一种“属于”对象的函数,并命名为obj.methodname,其中obj是某个对象(可能是表达式),而methodname是由对象的类型定义的方法的名称。不同的类型定义不同的方法。不同类型的方法可以使用相同的名称而不会引起歧义。 (可以使用* classes *定义自己的对象类型和方法,请参见Classes)示例中显示的append()方法是为列表对象定义的;它在列表的末尾添加了一个新元素。在此示例中,它等效于result = result + [a],但效率更高。

4.7. 有关定义函数的更多信息

也可以使用可变数量的参数定义函数。有三种形式可以组合。

4.7.1. 默认参数值

最有用的形式是为一个或多个参数指定默认值。这将创建一个函数,该函数可以使用比其定义所允许的参数更少的参数来调用。例如:

def ask_ok(prompt, retries=4, complaint='Yes or no, please!'):
    while True:
        ok = raw_input(prompt)
        if ok in ('y', 'ye', 'yes'):
            return True
        if ok in ('n', 'no', 'nop', 'nope'):
            return False
        retries = retries - 1
        if retries < 0:
            raise IOError('refusenik user')
        print complaint

可以pass几种方式调用此函数:

  • 仅给出强制性参数:ask_ok('Do you really want to quit?')

  • 提供可选参数之一:ask_ok('OK to overwrite the file?', 2)

  • 甚至提供所有参数:ask_ok('OK to overwrite the file?', 2, 'Come on, only yes or no!')

此示例还介绍了in关键字。这将测试序列是否包含某个值。

默认值在* defining *范围内的函数定义点进行评估,因此

i = 5

def f(arg=i):
    print arg

i = 6
f()

将打印5

重要警告: 默认值仅被评估一次。当默认值是可变对象(例如列表,字典或大多数类的实例)时,这会有所不同。例如,以下函数累积在后续调用中传递给它的参数:

def f(a, L=[]):
    L.append(a)
    return L

print f(1)
print f(2)
print f(3)

这将打印

[1]
[1, 2]
[1, 2, 3]

如果您不希望在后续调用之间共享默认值,则可以这样编写函数:

def f(a, L=None):
    if L is None:
        L = []
    L.append(a)
    return L

4.7.2. 关键字参数

也可以使用kwarg=value形式的keyword arguments调用函数。例如,以下Function:

def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'):
    print "-- This parrot wouldn't", action,
    print "if you put", voltage, "volts through it."
    print "-- Lovely plumage, the", type
    print "-- It's", state, "!"

接受一个必需的参数(voltage)和三个可选参数(stateactiontype)。可以pass以下任意一种方式调用此函数:

parrot(1000)                                          # 1 positional argument
parrot(voltage=1000)                                  # 1 keyword argument
parrot(voltage=1000000, action='VOOOOOM')             # 2 keyword arguments
parrot(action='VOOOOOM', voltage=1000000)             # 2 keyword arguments
parrot('a million', 'bereft of life', 'jump')         # 3 positional arguments
parrot('a thousand', state='pushing up the daisies')  # 1 positional, 1 keyword

但以下所有调用均无效:

parrot()                     # required argument missing
parrot(voltage=5.0, 'dead')  # non-keyword argument after a keyword argument
parrot(110, voltage=220)     # duplicate value for the same argument
parrot(actor='John Cleese')  # unknown keyword argument

在函数调用中,关键字参数必须位于位置参数之后。传递的所有关键字参数都必须与函数接受的参数之一匹配(例如actor不是parrot函数的有效参数),并且它们的 Sequences 并不重要。这也包括非可选参数(例如parrot(voltage=1000)也是有效的)。任何参数都不能多次收到一个值。由于此限制,以下示例失败:

>>> def function(a):
...     pass
...
>>> function(0, a=0)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: function() got multiple values for keyword argument 'a'

当存在形式为**name的finally形式参数时,它将接收一个字典(请参见Map 类型— dict),该字典包含除与形式参数相对应的所有关键词参数之外的所有关键词参数。可以将其与形式为*name的形式参数(在下一个小节中进行描述)组合,该形式参数接收一个 Tuples,其中包含形式参数之外的位置自变量。 (*name必须出现在**name之前.)例如,如果我们定义如下函数:

def cheeseshop(kind, *arguments, **keywords):
    print "-- Do you have any", kind, "?"
    print "-- I'm sorry, we're all out of", kind
    for arg in arguments:
        print arg
    print "-" * 40
    keys = sorted(keywords.keys())
    for kw in keys:
        print kw, ":", keywords[kw]

可以这样称呼:

cheeseshop("Limburger", "It's very runny, sir.",
           "It's really very, VERY runny, sir.",
           shopkeeper='Michael Palin',
           client="John Cleese",
           sketch="Cheese Shop Sketch")

当然会打印:

-- Do you have any Limburger ?
-- I'm sorry, we're all out of Limburger
It's very runny, sir.
It's really very, VERY runny, sir.
----------------------------------------
client : John Cleese
shopkeeper : Michael Palin
sketch : Cheese Shop Sketch

请注意,关键字参数名称列表是pass在打印其内容之前对关键字字典的keys()方法的结果进行排序而创建的;如果不这样做,则参数的打印 Sequences 是不确定的。

4.7.3. 任意参数列表

最后,最不常用的选项是指定可以使用任意数量的参数调用函数。这些参数将包装在一个 Tuples 中(请参见Tuples 和序列)。在可变数量的参数之前,可能会出现零个或多个常规参数。

def write_multiple_items(file, separator, *args):
    file.write(separator.join(args))

4.7.4. 解包参数列表

当参数已经在列表或 Tuples 中,但需要为需要单独的位置参数的函数调用拆包时,则发生相反的情况。例如,内置的range()函数需要单独的* start stop *参数。如果不能单独使用它们,请使用* -operator 编写函数调用,以将参数从列表或 Tuples 中解包:

>>> range(3, 6)             # normal call with separate arguments
[3, 4, 5]
>>> args = [3, 6]
>>> range(*args)            # call with arguments unpacked from a list
[3, 4, 5]

字典可以用相同的方式pass** -operator 传递关键字参数:

>>> def parrot(voltage, state='a stiff', action='voom'):
...     print "-- This parrot wouldn't", action,
...     print "if you put", voltage, "volts through it.",
...     print "E's", state, "!"
...
>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
>>> parrot(**d)
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !

4.7.5. Lambda 表达式

小型匿名函数可以使用lambda关键字创建。此函数返回其两个参数的总和:lambda a, b: a+b。 Lambda 函数可在需要函数对象的任何地方使用。在语法上将它们限制为单个表达式。从语义上讲,它们只是正常Function定义的语法糖。像嵌套函数定义一样,lambda 函数可以引用包含范围中的变量:

>>> def make_incrementor(n):
...     return lambda x: x + n
...
>>> f = make_incrementor(42)
>>> f(0)
42
>>> f(1)
43

上面的示例使用 lambda 表达式返回函数。另一个用途是传递一个小的函数作为参数:

>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]
>>> pairs.sort(key=lambda pair: pair[1])
>>> pairs
[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]

4.7.6. 文档字符串

关于文档字符串的内容和格式,有一些新兴的约定。

第一行应始终是对象用途的简短摘要。为简便起见,它不应明确语句对象的名称或类型,因为可以pass其他方式使用它们(除非名称恰好是描述函数操作的动词)。该行应以大写字母开头,以句点结尾。

如果文档字符串中还有更多行,则第二行应为空白,以可视方式将摘要与描述的其余部分分开。以下几行应为一个或多个段落,描述对象的调用约定,其副作用等。

Python 解析器不会从 Python 中的多行字符串 Literals 中去除缩进,因此,如果需要,处理文档的工具必须去除缩进。使用以下约定完成此操作。字符串的第一行之后的第一行非空白行确定整个文档字符串的缩进量。 (我们不能使用第一行,因为它通常与字符串的开头引号相邻,因此其缩进在字符串 Literals 中不明显.)然后,从字符串的所有行的开头去除与该缩进“等效”的空格。缩进较少的行不应发生,但如果发生缩进,则应删除所有前导空格。制表符展开后(通常为 8 个空格),应测试空格的等效性。

这是一个多行文档字符串的示例:

>>> def my_function():
...     """Do nothing, but document it.
...
...     No, really, it doesn't do anything.
...     """
...     pass
...
>>> print my_function.__doc__
Do nothing, but document it.

    No, really, it doesn't do anything.

4.8. 间奏曲:编码样式

现在您将要编写更长,更复杂的 Python,现在是讨论编码样式的好时机。多数语言可以用不同的风格来写(或更简洁,格式化)。有些比其他更具可读性。使他人易于阅读您的代码始终是一个好主意,采用良好的编码风格对此有很大帮助。

对于 Python,大多数项目都遵循 PEP 8作为样式指南。它促进了一种非常易读且令人赏心悦目的编码风格。每个 Python 开发人员都应该在某个时候阅读它。以下是为您提取的最重要的要点:

  • 使用 4 空格缩进,并且没有制表符。

4 空格是小压痕(允许更大的嵌套深度)和大压痕(易于阅读)之间的良好折衷。标签会引起混淆,最好不要使用。

  • 换行,使它们不超过 79 个字符。

这有助于小尺寸显示器的用户,并可以在大尺寸显示器上并排放置多个代码文件。

  • 使用空行分隔函数和类,并在函数内部使用较大的代码块。

  • 如有可能,将 Comments 放在自己的一行上。

  • Use docstrings.

  • 在运算符周围和逗号后使用空格,但不要在括号结构a = f(1, 2) + g(3, 4)中直接使用。

  • 一致地命名您的类和函数;约定是对类使用CamelCase,对函数和方法使用lower_case_with_underscores。始终使用self作为第一个方法参数的名称(有关类和方法的更多信息,请参见初识类)。

  • 如果您的代码打算在国际环境中使用,请不要使用奇特的编码。在任何情况下,纯 ASCII 效果最佳。

Footnotes

  • [1]
    • 实际上,“按对象引用调用”将是一个更好的描述,因为如果传递了可变对象,则调用者将看到被调用者对其进行的任何更改(将项目插入列表)。