在网上看见用Python用SGMLParser抓取网页连接的大部分都是用以下代码:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from sgmllib import SGMLParser
import urllib
import urllib2
import socket
socket.setdefaulttimeout(210)
class URLLister(SGMLParser):
|
||||||
|
class URLLister(SGMLParser): |
||||||
|
Copyright © 2010 代码工厂@Code Blocks Forge - All Rights Reserved
京ICP备06020298号 |
||||||