本篇文章由网友“小黑”投稿发布。上一节中,我们介绍了可以使用函数来实现代码的重利用。此外,还可以将功能相似的函数都写入到一个单独的文件里,这个文件就是一个模块。例如,我们先在hello.py文件中写入下面这段代码...

    页面导航: 前言:

    本篇文章由网友“小黑”投稿发布。

    本篇文章是根据《Python Tutorial》第15章的内容来写的学习笔记。该英文教程的下载地址如下:

    百度盘地址:http://pan.baidu.com/s/1c0eXSQG

    DropBox地址:点此进入DropBox链接

    Google Drive:点此进入Google Drive链接

    文章中的测试代码都是通过python 2.7.x的版本来执行的。

通过import导入模块:

    上一节中,我们介绍了可以使用函数来实现代码的重利用。此外,还可以将功能相似的函数都写入到一个单独的文件里,这个文件就是一个模块。例如,我们先在hello.py文件中写入下面这段代码:

def print_func(par):
	print 'hello : ', par
	return

def print_func2(par):
	print 'hello2s : ', par
	return


    在这里hello.py文件对应的模块名就是hello,在其他程序中就可以通过import之类的语句将hello模块导入进来,import的语法格式如下:

import module1[, module2[,... moduleN]]

    当Python执行到import语句时,会先在搜索路径中搜索模块文件,当搜索到文件时就会将其导入进来,搜索路径默认包含了当前目录在内,完整的搜索路径信息在稍后会进行介绍。以下是test.py文件中的测试代码:

import hello

hello.print_func('black')
hello.print_func2('black')


    这里假设test.py与hello.py位于同一个目录内,test.py脚本的执行结果如下:

black@slack:~/test$ python test.py 
hello :  black
hello2s :  black
black@slack:~/test$ 


    需要注意的是:如果不使用后面会介绍的reload函数的话,那么,不管你执行了多少次import,整个程序中单个模块只会被导入一次。这样可以避免模块被重复的加载执行。

from...import语句:

    我们还可以使用from...import语句将模块中指定的名称(可以是函数名,类名,变量名等)导入到当前的namespace(命名空间)中。from...import的语句格式如下:

from modname import name1[, name2[, ... nameN]]

    例如,我们只想导入前面hello模块中的print_func函数的话,就可以使用下面这段代码:

from hello import print_func

print_func('black')


    它不会将整个模块都导入进来,只会将print_func导入到当前的命名空间,此外,由于print_func存在于当前的命名空间中了,因此,就不需要使用hello.print_func这种方式来调用函数了,直接通过函数名就可以执行对应的函数。

    如果想将模块中的所有名称都导入到当前的命名空间中的话,可以使用下面这个语法:

from modname import *

    也就是通过指定星号这个通配符来导入所有的名称。不过,需要注意的是:如果当前脚本中存在相同的名称时,那么当前脚本里的名称可能会覆盖掉模块所导入的名称。例如,下面这段代码:

from hello import *

def print_func(par):
	print 'test : ', par
	return

print_func('black')
print_func2('black')


    上面这段代码的执行结果如下:

black@slack:~/test$ python test.py 
test :  black
hello2s :  black
black@slack:~/test$ 


    上面执行的是test.py文件里的print_func函数。这是因为test.py文件里的函数名称覆盖掉了hello模块中的同名函数,如果先在test.py文件里定义print_func函数,再从hello模块中导入名称时,那么,hello模块里的函数就会反过来覆盖掉test.py中的同名函数:

def print_func(par):
	print 'test:', par

from hello import *

print_func('black')
print_func2('black')


    这段代码的执行结果如下:

black@slack:~/test$ python test.py
hello: black
hello2s: black
black@slack:~/test$ 


模块文件的搜索路径:

    当导入模块时,Python会在以下路径中搜索模块文件:
  • 首先会在当前目录中搜索。
  • 如果当前目录没找到,则在PYTHONPATH环境变量指定的路径中进行搜索。
  • 如果上面两个路径都没找到,则会在Python的默认路径中进行搜索,例如,作者的默认路径是 /usr/local/lib/python2.7 。
    完整的搜索路径信息都存储在sys(系统模块)的path变量中:

import sys

print sys.path


    上面代码在作者的系统中的执行结果如下:

black@slack:~/test$ python test.py 
['/home/black/test', 
 '/usr/local/lib/python27.zip', 
 '/usr/local/lib/python2.7', ......]
black@slack:~/test$ 


    作者并没有设置PYTHONPATH环境变量,因此,上面的结果中只包含了当前目录与Python的默认路径。此外,默认路径在不同的Python版本以及不同的Python安装方式下都可能会不相同。

PYTHONPATH环境变量:

    通过指定PYTHONPATH环境变量,我们可以指定额外的搜索路径。

    在windows系统下,可以使用set命令来设置环境变量,例如下面这个命令:

set PYTHONPATH=G:\Python27\mytest\Phone

    在Linux系统中,如果和作者一样使用的是bash的shell,那么可以使用export命令,例如:

export PYTHONPATH=/home/black/test/Phone

    至于其他的shell,如csh之类的,就需要使用set命令,具体可以参考 http://www.cyberciti.biz/faq/unix-linux-adding-path/ 该链接对应的文章,这篇文章中介绍了如何在各个shell中设置PATH环境变量,我们可以将其设置方法应用到PYTHONPATH环境变量上。

    以下是一个简单的例子:

black@slack:~/test$ export PYTHONPATH=/home/black/test/Phone
black@slack:~/test$ python test.py 
['/home/black/test', 
 '/home/black/test/Phone',
 '/usr/local/lib/python27.zip', 
 '/usr/local/lib/python2.7', ......]
black@slack:~/test$ 


    可以看到,sys.path对应的搜索路径中,就将PYTHONPATH环境变量指定的路径给包含进来了。

命名空间:

    命名空间其实就是一个词典,该词典中的每个成员的key对应为名称(可以是变量名,函数名,模块名等),而成员的value则对应为具体的对象(可以是列表对象,元组对象,整数对象,函数对象,模块对象等)。在Python中使用某个名称时,内部会先在命名空间里查找该名称所映射的对象,当找到对象时,就可以使用该对象去执行各种操作了。

    Python程序中主要存在两个命名空间,一个local namespace(局部命名空间)和一个global namespace(全局命名空间)。可以通过locals与globals函数来查看到:

a = 123
b = 456

print 'local namespace:', locals(), '\n'
print 'global namespace:', globals()


    上面代码的执行结果如下:

black@slack:~/test$ python test.py 
local namespace: {'a': 123, 'b': 456, '__builtins__': <module '__builtin__' (built-in)>, '__file__': 'test.py', '__package__': None, '__name__': '__main__', '__doc__': None} 

global namespace: {'a': 123, 'b': 456, '__builtins__': <module '__builtin__' (built-in)>, '__file__': 'test.py', '__package__': None, '__name__': '__main__', '__doc__': None}
black@slack:~/test$ 


    命名空间中,双下划线开头与结尾的名称通常是Python预设的名称。可以看到,在全局范围内,局部与全局命名空间中的成员是一致的。下面再看下,函数的局部范围内,这两个命名空间的成员情况:

a = 123
b = 456

def print_func(par):
	myname = 'black'
	print myname, ':', par, '\n'
	print 'local namespace:', locals(), '\n'
	print 'global namespace:', globals()

print_func('test')


    这段代码的执行结果如下:

black@slack:~/test$ python test.py 
black : test 

local namespace: {'par': 'test', 'myname': 'black'} 

global namespace: {'a': 123, 'print_func': <function print_func at 0xb75f8e94>, 'b': 456, '__builtins__': <module '__builtin__' (built-in)>, '__file__': 'test.py', '__package__': None, '__name__': '__main__', '__doc__': None}
black@slack:~/test$ 


    在函数内,局部命名空间中就只包含了局部变量在内(函数的参数也属于局部变量),全局命名空间中则包含了外部的全局名称(全局变量,定义过的函数,导入过的模块等)。

    在一个函数里,既可以使用局部命名空间中的名称,又可以使用全局命名空间中的名称,当局部与全局命名空间中存在相同的名称时,起作用的会是局部命名空间中的名称。

    函数内被赋予了值的变量,都会被Python当作局部变量。例如下面这段代码:

total = 2000;

def AssignTotal():
	total = 100
	print 'inner total: ', total

print 'global total: ', total
AssignTotal()
print 'global total: ', total


    这段代码的执行结果如下:

black@slack:~/test$ python test.py 
global total:  2000
inner total:  100
global total:  2000
black@slack:~/test$ 


    由于total在AssignTotal函数中进行了赋值操作,因此就被Python假定为了局部变量。因此,默认情况下我们无法对全局变量进行设置操作,如果要在函数里对全局变量进行设置的话,就必须使用global关键字:

total = 2000

def AssignTotal():
	global total
	total = 3000
	print 'inner total:', total

print 'global total:', total
AssignTotal()
print 'global total:', total


    代码的执行结果如下:

black@slack:~/test$ python test.py 
global total: 2000
inner total: 3000
global total: 3000
black@slack:~/test$ 


    可以看到,使用global关键字后,就可以对全局变量进行设置操作了。

dir内建函数:

    如果你想查看导入的模块中,包含了哪些名称的话,可以使用dir内建函数:

import math

print dir(math)


    执行这段代码,可以得到如下结果:

black@slack:~/test$ python test.py 
['__doc__', '__file__', '__name__', '__package__', 
 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 
 'atanh', 'ceil', 'copysign', 'cos', 'cosh', 'degrees', 
 'e', 'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 
 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'hypot', 
 'isinf', 'isnan', 'ldexp', 'lgamma', 'log', 'log10', 
 'log1p', 'modf', 'pi', 'pow', 'radians', 'sin', 'sinh', 
 'sqrt', 'tan', 'tanh', 'trunc']
black@slack:~/test$ 


    可以看到,math模块中包含了很多与数学运算相关的函数,通过dir(math)就可以得到这些函数的名称。

    此外,在这些名称中,__doc__,__file__,__name__,__package__是Python预设的名称,分别表示:模块的说明介绍信息,模块的文件名(或文件路径),模块的名称,模块的包名(包的概念后面会介绍):

import math

print 'math.__file__:', math.__file__, '\n'
print 'math.__doc__:', math.__doc__, '\n'
print 'math.__name__:', math.__name__, '\n'
print 'math.__package__:', math.__package__, '\n'


    这段代码的执行结果如下:

black@slack:~/test$ python test.py 
math.__file__: /usr/local/lib/python2.7/lib-dynload/math.so 

math.__doc__: This module is always available.  It provides access to the
mathematical functions defined by the C standard. 

math.__name__: math 

math.__package__: None 

black@slack:~/test$ 


reload内建函数:

    前面提到过,当使用import导入模块时,模块只会被加载执行一次(不管你用import导入相同的模块多少次),如果我们想再次加载同一个模块的话,就可以使用reload函数,reload函数的语句格式为:

reload(module_name)

    参数是模块名(注意不是包含模块名的字符串),例如,想要重新加载hello模块的话,就可以使用下面这条语句:

reload(hello)

    你不可以写成reload("hello")。

    假设hello模块中的代码如下:

def print_func(par):
	print 'hello : ', par
	return

def print_func2(par):
	print 'hello2s : ', par
	return

print 'hello loaded!'


    主程序中就可以使用reload函数,重复加载执行该模块:

import hello

reload(hello)

hello.print_func('test')
hello.print_func2('test')


    代码的执行结果如下:

black@slack:~/test$ python test.py 
hello loaded!
hello loaded!
hello :  test
hello2s :  test
black@slack:~/test$ 


package(包):

    如果把前面介绍过的模块看成是单个python文件,那么这里的package(包)就可以看成是包含了很多模块文件的目录。通过导入包,就可以将对应目录下的模块都导入进来(当然包在被导入之后,其本质上也是一个模块对象,这在下面会进行介绍)。

    每个包所在的目录都需要包含一个__init__.py脚本文件,当通过import语句导入某个包时,就会执行该脚本文件。

    假设主程序是test.py,在主程序所在的目录中存在一个Phone目录,Phone目录内又存在三个模块文件:G3.py,Isdn.py,Pots.py 和一个 __init__.py的包初始化脚本文件,如下所示:

black@slack:~/test$ ls
Phone/  test.py
black@slack:~/test$ ls Phone
G3.py  __init__.py  Isdn.py  Pots.py
black@slack:~/test$ 


    Phone目录中的三个模块文件的代码如下:

black@slack:~/test$ cat Phone/G3.py
def G3():
	print "I'm G3 Phone"
black@slack:~/test$ cat Phone/Isdn.py
def Isdn():
	print "I'm Isdn Phone"
black@slack:~/test$ cat Phone/Pots.py
def Pots():
	print "I'm Pots Phone"
black@slack:~/test$ 


    接着,可以在包的初始化脚本__init__.py文件里,将这三个模块的函数都导入到包中:

from Pots import Pots
from Isdn import Isdn
from G3 import G3


    最后,主程序在导入了Phone包后,就可以直接通过Phone.Pots,Phone.G3以及Phone.Isdn来执行不同模块文件中定义的函数了:

import Phone

Phone.Pots()
Phone.G3()
Phone.Isdn()


    主程序的测试结果如下:

black@slack:~/test$ python test.py
I'm Pots Phone
I'm G3 Phone
I'm Isdn Phone
black@slack:~/test$ 


    包里面其实还可以导入子包(子目录),或者子包的子包(子目录的子目录)。

    当然,包在通过import语句导入之后,本质上就是一个模块对象:

import Phone

print Phone


    代码的执行结果如下:

black@slack:~/test$ python test.py
<module 'Phone' from '/home/black/test/Phone/__init__.pyc'>
black@slack:~/test$ 


    可以看到,Phone就是一个module(模块对象),该模块对应的脚本文件为__init__.pyc,模块的原脚本文件会被Python解析为pyc结尾的字节码文件,如果存在同名的字节码文件,就会加载执行字节码文件,否则就会去加载原脚本文件。

    如果Phone目录中还包含一个subphone的子目录的话,而且subphone目录内也包含相关模块文件与__init__.py初始化脚本文件的话,那么可以使用以下语句,将subphone给导入进来:

import Phone.subphone

结束语:

    这世上原本就没有什么神话。所谓的神话,不过是常人的思维所不易理解的平常事。

——  天道

    原作者经常提到的《天道》是一部根据豆豆的长篇小说《遥远的救世主》改编的电视剧。有兴趣的读者可以看一下。
 
上下篇

下一篇: Python基本的I/O操作 (一)

上一篇: Python用户自定义函数

相关文章

Python循环语句

Python列表类型

Python三角函数

Python基本的I/O操作 (三)

Python中的异常

Python随机数函数