凡是涉及到对页面的处理,就需要一个强大的HTML/XML Parser支持解析,通过对目标文件的格式化处理,我们才能够实现特定信息提取、特定信息删除和遍历等操作。使用过靓汤Beautiful Soap和ElementTree,个人感觉Beautiful Soap可以实现很多功能,但是性能不是太好。下面这篇文章具体分析和比较了各种常用解析器的性能供大家参考,包括lxml, HTMLParser, cElementTree等。
|
||||||
|
|
||||||
|
Copyright © 2010 代码工厂@Code Blocks Forge - All Rights Reserved
京ICP备06020298号 |
||||||