16.7. mmap-内存 Map 文件支持

内存 Map 的文件对象的行为既类似于字符串,又类似于文件对象。但是,与普通的字符串对象不同,它们是可变的。您可以在大多数需要使用字符串的地方使用 mmap 对象。例如,您可以使用re模块搜索内存 Map 文件。由于它们是可变的,因此您可以pass执行obj[index] = 'a'来更改单个字符,或者pass分配给切片obj[i1:i2] = '...'来更改子字符串。您还可以从当前文件位置开始读取和写入数据,并pass文件seek()到不同位置。

mmap构造函数创建一个内存 Map 文件,该文件在 Unix 和 Windows 上有所不同。无论哪种情况,都必须为打开的文件提供文件 Descriptors 以进行更新。如果要 Map 现有的 Python 文件对象,请使用其fileno()方法获取* fileno *参数的正确值。否则,您可以使用os.open()函数打开文件,该函数直接返回文件 Descriptors(完成后仍需要关闭文件)。

Note

如果要为可写的缓冲文件创建内存 Map,则应先flush()文件。必须确保对缓冲区的本地修改实际上可用于 Map。

对于 Unix 和 Windows 版本的构造函数,可以将* access *指定为可选的关键字参数。 * access *接受以下三个值之一:ACCESS_READACCESS_WRITEACCESS_COPY分别指定只读,直写或写时复制内存。 * access 可以在 Unix 和 Windows 上使用。如果未指定 access *,则 Windows mmap 返回直写 Map。这三种访问类型的初始内存值均取自指定的文件。分配给ACCESS_READ内存 Map 会引发TypeError异常。分配给ACCESS_WRITE内存 Map 会影响内存和基础文件。分配给ACCESS_COPY内存 Map 会影响内存,但不会更新基础文件。

在版本 2.5 中进行了更改:要 Map 匿名内存,应将-1 作为文件名和长度一起传递。

在 2.6 版中进行了更改:mmap.mmap 以前是工厂函数,用于创建 mmap 对象。现在,mmap.mmap 是类本身。

可以指定* access 代替 flags 和* prot 作为可选关键字参数。同时指定 flags,* prot access 都是错误的。有关如何使用此参数的信息,请参见上面对 access *的描述。

为确保创建的内存 Map 的有效性,Descriptors* fileno *指定的文件在内部自动与 Mac OS X 和 OpenVMS 上的物理后备存储同步。

此示例显示了使用mmap的简单方法:

import mmap

# write a simple example file
with open("hello.txt", "wb") as f:
    f.write("Hello Python!\n")

with open("hello.txt", "r+b") as f:
    # memory-map the file, size 0 means whole file
    mm = mmap.mmap(f.fileno(), 0)
    # read content via standard file methods
    print mm.readline()  # prints "Hello Python!"
    # read content via slice notation
    print mm[:5]  # prints "Hello"
    # update content using slice notation;
    # note that new content must have same size
    mm[6:] = " world!\n"
    # ... and read again using standard file methods
    mm.seek(0)
    print mm.readline()  # prints "Hello  world!"
    # close the map
    mm.close()

下一个示例演示如何创建匿名 Map 并在父进程和子进程之间交换数据:

import mmap
import os

mm = mmap.mmap(-1, 13)
mm.write("Hello world!")

pid = os.fork()

if pid == 0:  # In a child process
    mm.seek(0)
    print mm.readline()

    mm.close()

内存 Map 文件对象支持以下方法:

(Windows 版本) 返回非零值表示成功;零表示失败。

(Unix 版本) 返回零值表示成功。呼叫失败时引发异常。

首页