如鹏网 大学生计算机学习社区

CowNew开源团队

http://www.cownew.com 邮件请联系 about521 at 163.com

  BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  363 随笔 :: 2 文章 :: 808 评论 :: 0 Trackbacks

Python 的模块一旦加载就会常驻内存,直到程序结束。再碰到 import 语句式只是修改名字空间,而不需要重新加载。这种机制是出于运行时的效率考虑,每遇到 import 的时候重新加载显然很低效。它也不会检查源文件的修改时间以确定是否重新加载,Python 有那么多的模块,每次调用时都检查一遍时间也是不行的。

这种机制下,开发长时间运行的守护程序就会很麻烦,修改源代码后要重新启动程序才能让新的代码生效。比如用 mod_python 做 web 开发,Apache 会启动多个守护进程来应答客户请求,里面有 python 的解释引擎和加载的模块,若要让修改后的代码生效只能重起 apache,这会影响到其它服务的正常运行,非常不方便。mod_python 有一个PythonAutoReload 参数,它只是针对 PythonHandler 而言的,能够对设定的 PythonHandler 实现自动重新加载,而该 Handler 中所用到的模块却不能自动 reload。

这种修改源代码然后重起 apache 的调试方式实在让我无法忍受了,决定实现一种自动重新加载机制。基本的思路就是每个用户请求到来时,检查我所关心的那些模块源文件的修改时间,如果比加载时的修改时间新,则重新加载。

编写一个检测时间和重新加载的函数,让它在每个请求到来时执行:

  1. def  autoreload():   
  2.   mod_names = ['Entry','Index','SideBar']   
  3.    for  mod_name  in  mod_names:   
  4.      try :   
  5.       module =  sys .modules[ mod_name ]   
  6.      except :   
  7.        continue   
  8.     mtime =  os .path.getmtime( module.__file__ )   
  9.      try :   
  10.        if  mtime > module.loadtime:   
  11.          reload ( module )   
  12.      except :   
  13.      pass   
  14.     module.loadtime = mtime   

这段代码不长,但是改了好多个版本,最开始用 has_key() 的方式来检测是否存在某个模块,检测该模块是否有 loadtime 属性( 用 module.__dict__ ),现在这种方式应该效率高一些,曾经在一个 blog 上看到过对比测试数据。起初还在每个关心的模块里面加上一句loadtime = os.path.getmtime( __file__ ),这是不必要的,因为 Python 用的是动态类型,可以在运行时追加属性,第一次检测时设置初始状态即可。

有了这段代码,开发 BlogXP 方便多了,改了源码之后立马就能生效,而且它在正常运行时的消耗也很小。另外,由于mod_python 能够实现指定的 Handler 的自动重新加载,将这段代码放在该 Handler 中,可以方便地改变所关心的模块列表,也不需重起 apache。

欢迎批评指正:-)
from: http://blog.daviesliu.net/article/entry20050610-235635

posted on 2007-03-12 14:57 CowNew开源团队 阅读(1719) 评论(2)  编辑  收藏

评论

# re: Python Module Auto Reload [未登录] 2007-09-11 11:54 呵呵
有点多余,

mod_python.module_import() 就可以 autoreload.
handler 也可以 autoreload 的  回复  更多评论
  

# re: Python Module Auto Reload [未登录] 2009-03-18 18:42 joyce
如果要reload关心的模块, 但此时这个模块现在正为其他请求服务呢, 你仍然要reload就会中断正在服务的进程。
  回复  更多评论
  


只有注册用户登录后才能发表评论。


网站导航: