Python学习笔记一 - 路漫漫其修远兮，吾将上下而求索

Python学习笔记一

发现很多公司要求掌握一门脚本语言，一直也想搞搞这个，看C++，Linux C编程也只是为了对系统更加的了解，唉，我的工作定位好像一直都不怎么明确，是要搞个自己最擅长的了，以后有时间再搞linuxC，找工作第一位。。。工作基本定位在 Java+python，大部分公司也不会要求一个人既做Java也做C++。再说这语言也是大同小异，关键还是编程思想

d = {"server":"mpilgrim", "database":"master"}

li = ["a", "b", "mpilgrim", "z", "example"]

Tuple 是不可变的 list。一旦创建了一个 tuple，就不能以任何方式改变它
t = ("a", "b", "mpilgrim", "z", "example")

连接 list 与分割字符串
>>> li = ['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> s = ";".join(li)
>>> s
'server=mpilgrim;uid=sa;database=master;pwd=secret'
>>> s.split(";")
['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> s.split(";", 1)
['server=mpilgrim', 'uid=sa;database=master;pwd=secret']

使用 type、str、dir 和其它内置函数

4.3.2. str 函数
str 将数据强制转换为字符串。每种数据类型都可以强制转换为字符串。

例 4.6. str 介绍
>>> str(1)
'1'
>>> horsemen = ['war', 'pestilence', 'famine']
>>> horsemen
['war', 'pestilence', 'famine']
>>> horsemen.append('Powerbuilder')
>>> str(horsemen)
"['war', 'pestilence', 'famine', 'Powerbuilder']"
>>> str(odbchelper)
"<module 'odbchelper' from 'c:\\docbook\\dip\\py\\odbchelper.py'>"
>>> str(None)
'None' 对于简单的数据类型比如整型，你可以预料到 str 的正常工作，因为几乎每种语言都有一个

将整型转化为字符串的函数。
然而 str 可以作用于任何数据类型的任何对象。这里它作用于一个零碎构建的列表。
str 还允许作用于模块。注意模块的字符串形式表示包含了模块在磁盘上的路径名，所以你的显示

结果将会有所不同。
str 的一个细小但重要的行为是它可以作用于 None，None 是 Python 的 null 值。这个调用返回字符

串 'None'。你将会使用这一点来改进你的 info 函数，这一点你很快就会看到。

dir 函数返回任意对象的属性和方法列表，包括模块对象、函数对象、字符串对象、列表对象、字

典对象 …… 相当多的东西。

例 4.7. dir 介绍
>>> li = []
>>> dir(li)
['append', 'count', 'extend', 'index', 'insert',
'pop', 'remove', 'reverse', 'sort']
>>> d = {}
>>> dir(d)
['clear', 'copy', 'get', 'has_key', 'items', 'keys', 'setdefault', 'update', 'values']
>>> import odbchelper
>>> dir(odbchelper)
['__builtins__', '__doc__', '__file__', '__name__', 'buildConnectionString']

最后是 callable 函数，它接收任何对象作为参数，如果参数对象是可调用的，返回 True；否则返回

False。可调用对象包括函数、类方法，甚至类自身 (下一章将更多的关注类)。

例 4.8. callable 介绍
>>> import string
>>> string.punctuation
'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
>>> string.join
<function join at 00C55A7C>
>>> callable(string.punctuation)
False
>>> callable(string.join)
True

你已经知道 Python 函数是对象。你不知道的是，使用 getattr 函数，可以得到一个直到运行时才知

道名称的函数的引用。

例 4.10. getattr 介绍
>>> li = ["Larry", "Curly"]
>>> li.pop
<built-in method pop of list object at 010DF884>
>>> getattr(li, "pop")
<built-in method pop of list object at 010DF884>
>>> getattr(li, "append")("Moe")
>>> li
["Larry", "Curly", "Moe"]
>>> getattr({}, "clear")
<built-in method clear of dictionary object at 00F113D4>
>>> getattr((), "pop")
Traceback (innermost last):
File "<interactive input>", line 1, in ?
AttributeError: 'tuple' object has no attribute 'pop'

4.4.1. 用于模块的 getattr
getattr 不仅仅适用于内置数据类型，也可作用于模块。

例 4.11. apihelper.py 中的 getattr 函数
>>> import odbchelper
>>> odbchelper.buildConnectionString
<function buildConnectionString at 00D18DD4>
>>> getattr(odbchelper, "buildConnectionString")
<function buildConnectionString at 00D18DD4>
>>> object = odbchelper
>>> method = "buildConnectionString"
>>> getattr(object, method)
<function buildConnectionString at 00D18DD4>
>>> type(getattr(object, method))
<type 'function'>
>>> import types
>>> type(getattr(object, method)) == types.FunctionType
True
>>> callable(getattr(object, method))
True

使用 getattr，你能够获得同一函数的同一引用。通常，getattr(object, "attribute") 等价于

object.attribute。如果 object 是一个模块的话，那么 attribute 可能是定义在模块中的任何东西：函数

、类或者全局变量。

就是相当于函数的指针
例 4.12. 使用getattr 创建分发者

import statsout

def output(data, format="text"):
    output_function = getattr(statsout, "output_%s" % format)
    return output_function(data)
output 函数接收一个必备参数 data，和一个可选参数 format。如果没有指定 format 参数，其缺省

值是 text 并完成普通文本输出函数的调用。
你可以连接 format 参数值和 "output_" 来创建一个函数名称作为参数值，然后从 statsout 模块中取

得该函数。这种方式允许今后很容易地扩展程序以支持其它的输出格式，而且无需修改分发函数。

所要做的仅仅是向 statsout 中添加一个函数，比如 output_pdf，之后只要将 “pdf” 作为 format 的参

数值传递给 output 函数即可。
现在你可以简单地调用输出函数，就像调用其它函数一样。output_function 变量是指向 statsout 模

块中相应函数的引用。

你是否发现前面示例的一个 Bug？即字符串和函数之间的松耦合，而且没有错误检查。如果用户传

入一个格式参数，但是在 statsout 中没有定义相应的格式输出函数，会发生什么呢？还好，getattr

会返回 None，它会取代一个有效函数并被赋值给 output_function，然后下一行调用函数的语句将会

失败并抛出一个异常。这种方式不好。

值得庆幸的是，getattr 能够使用可选的第三个参数，一个缺省返回值。

[mapping-expression for element in source-list if filter-expression]

>>> li = ["a", "mpilgrim", "foo", "b", "c", "b", "d", "d"]
>>> [elem for elem in li if len(elem) > 1]
['mpilgrim', 'foo']
>>> [elem for elem in li if elem != "b"]
['a', 'mpilgrim', 'foo', 'c', 'd', 'd']
>>> [elem for elem in li if li.count(elem) == 1]
['a', 'mpilgrim', 'foo', 'c']

使用 and 时，在布尔环境中从左到右演算表达式的值。0、''、[]、()、{}、None 在布尔环境中为假；

其它任何东西都为真。还好，几乎是所有东西。默认情况下，布尔环境中的类实例为真，但是你可

以在类中定义特定的方法使得类实例的演算值为假。

4.6.1. 使用 and-or 技巧
例 4.17. and-or 技巧介绍
>>> a = "first"
>>> b = "second"
>>> 1 and a or b
'first'
>>> 0 and a or b
'second'
这个语法看起来类似于 C 语言中的 bool ? a : b 表达式。整个表达式从左到右进行演算，所以先进

行 and 表达式的演算。1 and 'first' 演算值为 'first'，然后 'first' or 'second' 的演算值为 'first'。
0 and 'first' 演算值为 False，然后 0 or 'second' 演算值为 'second'。

然而，由于这种 Python 表达式单单只是进行布尔逻辑运算，并不是语言的特定构成，这是 and-or

技巧和 C 语言中的 bool ? a : b 语法非常重要的不同。如果 a 为假，表达式就不会按你期望的那样

工作了。(你能知道我被这个问题折腾过吗？不止一次？)

Python 支持一种有趣的语法，它允许你快速定义单行的最小函数。这些叫做 lambda 的函数，是从

Lisp 借用来的，可以用在任何需要函数的地方。
例 4.20. lambda 函数介绍
>>> def f(x):
... return x*2
...
>>> f(3)
6
>>> g = lambda x: x*2
>>> g(3)
6
>>> (lambda x: x*2)(3)
6

总的来说，lambda 函数可以接收任意多个参数 (包括可选参数) 并且返回单个表达式的值。lambda

函数不能包含命令，包含的表达式不能超过一个。不要试图向 lambda 函数中塞入太多的东西；如

果你需要更复杂的东西，应该定义一个普通函数，然后想让它多长就多长。

例 4.25. 打印列表
>>> li = ['a', 'b', 'c']
>>> print "\n".join(li)
a
b
c 在你处理列表时，这确实是一个有用的调试技巧。在 Python 中，你会十分频繁地操作列表。

在 2.2.1 版本之前，Python 没有单独的布尔数据类型。为了弥补这个缺陷，Python 在布尔环境 (如 if

语句) 中几乎接受所有东西，遵循下面的规则：
0 为 false; 其它所有数值皆为 true。
空串 ("") 为 false; 其它所有字符串皆为 true。
空 list ([]) 为 false; 其它所有 list 皆为 true。
空 tuple (()) 为 false; 其它所有 tuple 皆为 true。
空 dictionary ({}) 为 false; 其它所有 dictionary 皆为 true。

下面是 from module import 的基本语法：

from UserDict import UserDict
它与你所熟知的 import module 语法很相似，但是有一个重要的区别：UserDict 被直接导入到局部

名字空间去了，所以它可以直接使用，而不需要加上模块名的限定。你可以导入独立的项或使用

from module import * 来导入所有东西。

Python 中的 from module import * 像 Java 中的 import module.* ；Python 中的 import module 像 Java

中的 import module

什么时候你应该使用 from module import？

如果你要经常访问模块的属性和方法，且不想一遍又一遍地敲入模块名，使用 from module import

。
如果你想要有选择地导入某些属性和方法，而不想要其它的，使用 from module import。
如果模块包含的属性和方法与你的某个模块同名，你必须使用 import module 来避免名字冲突。

尽量少用 from module import * ，因为判定一个特殊的函数或属性是从哪来的有些困难，并且会造

成调试和重构都更困难。

from UserDict import UserDict

class FileInfo(UserDict):
在 Python 中，类的基类只是简单地列在类名后面的小括号里。不像在 Java 中有一个特殊的

extends 关键字。

Python 支持多重继承。在类名后面的小括号中，你可以列出许多你想要的类名，以逗号分隔。

class FileInfo(UserDict):
    "store file metadata"
    def __init__(self, filename=None):
        UserDict.__init__(self)
        self["name"] = filename
                                         一些伪面向对象语言，像 Powerbuilder 有一种“扩展”构造函数和其它事件的

概念，即父类的方法在子类的方法执行前被自动调用。Python 不是这样，你必须显示地调用在父类中的合适方法。
我告诉过你，这个类像字典一样工作，那么这里就是第一个印象。我们将参数 filename 赋值给对象 name 关键字，作为它的值。注意 __init__ 方法从不返回一个值。
Java中是自动调用默认的无参的父类的构造函数

例 5.9. 定义 UserDict 类

class UserDict:
    def __init__(self, dict=None):
        self.data = {} ×××××××××××××××××××××××××××××××××××定义类的实例变量
        if dict is not None: self.update(dict)
注意 UserDict 是一个基类，不是从任何其他类继承而来。
这就是我们在 FileInfo 类中进行了覆盖的 __init__ 方法。注意这个父类的参数列表与子类不同。很

好，每个子类可以拥有自已的参数集，只要使用正确的参数调用父类就可以了。这里父类有一个定

义初始值的方法 (通过在 dict 参数中传入一个字典)，这一方法我们的 FileInfo 没有用上。

××××××××××××××××××××××××××××××××与Java的不同×××××××××××××××××××××××××××××××××××
与Java的不同，
1，Python中类的类属性是是在类的后面直接定义的
2，而实例变量是在在__init__方法中直接定义的使用如下方式self.instancevariable=***定义,
3，然后Python中实例方法都要显示的加上self（相当于Java的this)参数，方法中引用实例变量时也要通过self来引用

Python 支持数据属性 (在 Java 叫做 “实例变量”，在 C++ 中叫 “数据成员”)，它是由某个特定的类实

例所拥有的数据。在本例中，每个 UserDict 实例将拥有一个 data 数据属性。要从类外的代码引用

这个属性，需要用实例的名字限定它，instance.data，限定的方法与你用模块的名字来限定函数一

样。要在类的内部引用一个数据属性，我们使用 self 作为限定符。习惯上，所有的数据属性都在

__init__ 方法中初始化为有意义的值。然而，这并不是必须的，因为数据属性，像局部变量一样，

当你首次赋给它值的时候突然产生。
×××××××××××××××××××××××××××××××××与Java的不同××××××××××××××××××××××××××××××××××

Java 支持通过参数列表的重载，也就是一个类可以有同名的多个方法，但这些方法或者是参数个

数不同，或者是参数的类型不同。
Python 两种都不支持，总之是没有任何形式的函数重载。一个 __init__ 方法就是一个 __init__ 方法

，不管它有什么样的参数。每个类只能有一个 __init__ 方法，并且如果一个子类拥有一个 __init__

方法，它总是覆盖父类的 __init__ 方法，甚至子类可以用不同的参数列表来定义它。

想想为什么不支持方法重载，是因为Python的参数可以定义默认实参，有缺省值
×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
应该总是在 __init__ 方法中给一个实例的所有数据属性赋予一个初始值。这样做将会节省你在后面

调试的时间，不必为捕捉因使用未初始化 (也就是不存在) 的属性而导致的 AttributeError 异常费时费

力。
class MP3FileInfo(FileInfo):
mp3file.__class__ is fileinfo.MP3FileInfo true
mp3file.__class__ is fileinfo.FileInfo false
isinstance(mp3file,fileinfo.MP3FileInfo) true
isinstance(mp3file,fileinfo.FileInfo) true

li=[1,2,3]
li2[1,2,3]
li==li2 true 相当于Java的equals()
li is li2 false 相当于Java的==

5.7. 高级专用类方法
除了 __getitem__ 和 __setitem__ 之外 Python 还有更多的专用函数。某些可以让你模拟出你甚至可

能不知道的功能。

下面的例子将展示 UserDict 一些其他专用方法。

例 5.16. UserDict 中更多的专用方法
    def __repr__(self): return repr(self.data)
    def __cmp__(self, dict):
        if isinstance(dict, UserDict):
            return cmp(self.data, dict.data)
        else:
            return cmp(self.data, dict)
    def __len__(self): return len(self.data)
    def __delitem__(self, key): del self.data[key]   __repr__ 是一个专用的方法，在当调用 repr

(instance) 时被调用。repr 函数是一个内置函数，它返回一个对象的字符串表示。它可以用在任何

对象上，不仅仅是类的实例。你已经对 repr 相当熟悉了，尽管你不知道它。在交互式窗口中，当你

只敲入一个变量名，接着按ENTER，Python 使用 repr 来显示变量的值。自已用一些数据来创建一

个字典 d ，然后用 print repr(d) 来看一看吧。
__cmp__ 在比较类实例时被调用。通常，你可以通过使用 == 比较任意两个 Python 对象，不只是

类实例。有一些规则，定义了何时内置数据类型被认为是相等的，例如，字典在有着全部相同的关

键字和值时是相等的。对于类实例，你可以定义 __cmp__ 方法，自已编写比较逻辑，然后你可以

使用 == 来比较你的类，Python 将会替你调用你的 __cmp__ 专用方法。
__len__ 在调用 len(instance) 时被调用。len 是一个内置函数，可以返回一个对象的长度。它可以

用于任何被认为理应有长度的对象。字符串的 len 是它的字符个数；字典的 len 是它的关键字的个

数；列表或序列的 len 是元素的个数。对于类实例，定义 __len__ 方法，接着自已编写长度的计算

，然后调用 len(instance)，Python 将替你调用你的 __len__ 专用方法。
__delitem__ 在调用 del instance[key] 时调用，你可能记得它作为从字典中删除单个元素的方法。

当你在类实例中使用 del 时，Python 替你调用 __delitem__ 专用方法。

在 Java 中，通过使用 str1 == str2 可以确定两个字符串变量是否指向同一块物理内存位置。这叫做

对象同一性，在 Python 中写为 str1 is str2。在 Java 中要比较两个字符串值，你要使用 str1.equals

(str2)；在 Python 中，你要使用 str1 == str2。某些 Java 程序员，他们已经被教授得认为，正是因为

在 Java 中 == 是通过同一性而不是值进行比较，所以世界才会更美好。这些人要接受 Python 的这

个“严重缺失”可能要花些时间。

ord("a") 97
ord("A") 65

5.8. 类属性介绍
你已经知道了数据属性，它们是被一个特定的类实例所拥有的变量。Python 也支持类属性，它们是

由类本身所拥有的。

例 5.17. 类属性介绍

class MP3FileInfo(FileInfo):
    "store ID3v1.0 MP3 tags"
    tagDataMap = {"title"   : ( 3, 33, stripnulls),
                  "artist" : ( 33, 63, stripnulls),
                  "album"   : ( 63, 93, stripnulls),
                  "year"    : ( 93, 97, stripnulls),
                  "comment" : ( 97, 126, stripnulls),
                  "genre"   : (127, 128, ord)}

例 5.18. 修改类属性,Java中的静态变量
>>> class counter:
...     count = 0
...     def __init__(self):
...         self.__class__.count += 1 #一定得用self.__class__来引用，才是类变量，假如用self.count则定义的是实例变量,或者用
            Counter.count +=1
...
上述代码记录创建的对象的个数

5.9. 私有函数
与大多数语言一样，Python 也有私有的概念：

私有函数不可以从它们的模块外面被调用
私有类方法不能够从它们的类外面被调用
私有属性不能够从它们的类外面被访问
与大多数的语言不同，一个 Python 函数，方法，或属性是私有还是公有，完全取决于它的名字。

如果一个 Python 函数，类方法，或属性的名字以两个下划线开始 (但不是结束)，它是私有的；其它

所有的都是公有的。 Python 没有类方法保护的概念 (只能用于它们自已的类和子类中)。类方法或

者是私有 (只能在它们自已的类中使用) 或者是公有 (任何地方都可使用)。

在 MP3FileInfo 中，有两个方法：__parse 和 __setitem__。正如我们已经讨论过的，__setitem__

是一个专有方法；通常，你不直接调用它，而是通过在一个类上使用字典语法来调用，但它是公有

的，并且如果有一个真正好的理由，你可以直接调用它 (甚至从 fileinfo 模块的外面)。然而，

__parse 是私有的，因为在它的名字前面有两个下划线。

在 Python 中，所有的专用方法 (像 __setitem__) 和内置属性 (像 __doc__) 遵守一个标准的命名习惯

：开始和结束都有两个下划线。不要对你自已的方法和属性用这种方法命名；到最后，它只会把你 (或其它人) 搞乱。

#!/usr/bin/env python

#coding=utf-8

import os

import sys

from UserDict import UserDict

def stripnulls(data):

"strip whitespace and null"

return data.replace("\00","").strip()

class FileInfo(UserDict):

"store file metadata"

def __init__(self,filename=None):

UserDict.__init__(self)

#will trigger the __setitem__ method,and this method be override in the sub class

self["name"]=filename

class MP3FileInfo(FileInfo):

"store ID3v1.0 MP3 tags"

tagDataMap={"title":(3,33,stripnulls),

"artist":(33,63,stripnulls),

"album" :(63,93,stripnulls),

"year" :(93,97,stripnulls),

"comment":(97,126,stripnulls),

"genre" :(127,128,ord)}

def __parse(self,filename):

"parse ID3v1.0 tags from Mp3 file"

self.clear()

try:

fsock = open(filename,"rb",0)

try:

fsock.seek(-128,2)

tagdata = fsock.read(128)

finally:

fsock.close()

if tagdata[:3]=="TAG":

for tag,(start,end,parseFunc) in self.tagDataMap.items():

self[tag] = parseFunc(tagdata[start:end])

except IOError:

pass

def __setitem__(self,key,item):

if key == "name" and item:

self.__parse(item)

FileInfo.__setitem__(self,key,item)

def listDirectory(directory,fileExtList):

"get list of file info object for files of particular"

fileList = [os.path.normcase(f)

for f in os.listdir(directory)]

fileList = [os.path.join(directory,f)

for f in fileList if os.path.splitext(f)[1] in fileExtList]

def getFileInfoClass(filename,module=sys.modules[FileInfo.__module__]):

"get file into class from filename extension"

subclass = "%sFileInfo" % os.path.splitext(filename)[1].upper()[1:]

return hasattr(module,subclass) and getattr(module,subclass) or FileInfo

return [getFileInfoClass(f)(f) for f in fileList]

if __name__=="__main__":

for info in listDirectory("G:\\test",[".mp3"]):

print "\n".join(["%s=%s" % (k,v) for (k,v) in info.items()])

posted on 2009-08-22 00:02 Frank_Fang 阅读(4263) 评论(0) 编辑收藏所属分类: Python学习

常用链接

留言簿(1)

随笔分类(204)

随笔档案(100)

收藏夹(8)

牛人博客链接

搜索

最新评论

阅读排行榜

评论排行榜


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: Python学习笔记（二） Python学习笔记一