python通过urllib2爬网页上种子下载示例


在Python中,`urllib2`模块在Python 2中是用于网络请求的一个标准库,但在Python 3中,它已经被`urllib.request`所取代。不过,为了回答你的问题,我会提供一个基于Python 2的`urllib2`示例,以及一个基于Python 3的`urllib.request`示例,因为Python 2已经不再被推荐用于新开发的应用。

### Python 2 (使用urllib2)

注意:由于Python 2已经停止支持,这里仅作为学习参考。


import urllib2

def fetch_url(url):
    # 打开网页
    response = urllib2.urlopen(url)
    # 读取网页内容
    html = response.read()
    # 关闭连接
    response.close()
    # 假设我们要打印或处理网页内容
    print(html)

# 示例URL,请替换为实际的种子下载页面URL
url = 'http://example.com/seeds/download'
fetch_url(url)

### Python 3 (使用urllib.request)


from urllib.request import urlopen

def fetch_url(url):
    # 打开网页
    with urlopen(url) as response:
        # 读取网页内容
        html = response.read()
        # Python 3 中,bytes 类型的 html 需要解码为 str
        html_str = html.decode('utf-8')
        # 打印或处理网页内容
        print(html_str)

# 示例URL,请替换为实际的种子下载页面URL
url = 'http://example.com/seeds/download'
fetch_url(url)

注意:在实际应用中,下载种子文件(或其他大文件)时,可能需要考虑使用更高级的库(如`requests`)来处理网络请求,以及使用文件I/O操作将下载的内容保存到磁盘上,而不是直接打印到控制台。

此外,进行网页爬取时,请确保遵守目标网站的`robots.txt`文件规定,以及相关的法律法规和道德准则。