在 Python 中，我们常常需要下载文件，例如爬虫下载页面中的图片、下载页面的链接pdf文件或者word文档、音频和视频；下载远程服务器上的资源，如压缩文件、视频、grib2等等。那么我们可以通过哪些方法来实现文件的下载呢？

需要说明的是：本例子使用下载网址为：http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3，是一首MP3的歌曲，4M的大小。粉丝可以在评论区讨论。

第一、使用requests

Requests 是 Python 中非常常用的第三方库，是一个非常强大、简单易用的 HTTP 请求库。

我们直接采用requests.get 获得文件的内容，然后二进制的方法保存文件内容。url：下载的文件名；localfile：保存的本地文件名。timeout：单位秒，如果文件比较大，可以适当的延长时间。如果文件比较大，需要下载比较长的时间，这个方法就不太适合了。示例代码如下：

import requestsurl = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'#url：下载的文件名；localfile：保存的本地文件名。timeout：单位秒r = requests.get(url,timeout=300)with open(localfile, "wb") as fp: fp.write(r.content)

第二、使用urllib

urllib库是Python的标准库，因此不需要安装它。 urllib 库是一个非常方便的下载工具，提供了简单易用的下载接口。调用 urllib 库的 urlretrieve() 方法下载文件。示例代码如下：

import urllib.requesturl = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'urllib.request.urlretrieve(url, localfile)

第三、使用urllib2

urllib2库是urllib库的增强版，提供了更多的功能和更好的错误处理。需要说明的是：urllib2 是 Python2.7 自带的模块(不需要下载，导入即可使用)，在 python3 中，urllib2 被改为urllib.request。为了教程的完整性，还是在这里介绍一下。示例代码如下：

import urllib2 url = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'data = urllib2.urlopen(url).read()with open(localfile, 'wb') as video: video.write(data)

第四、使用urllib3

urllib3是urllib模块的改进版本，是一个轻量级的python库，提供了线程安全，HTTP连接池和重用，文件发送等。我们将通过使用urllib3来获取一个链接并将它存储在一个文件中。示例代码如下：

import urllib3 url = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'#创建一个HTTP连接池http = urllib3.PoolManager()r = http.request('GET',url)print(r.data)with open(localfile, 'wb') as mp3: mp3.write(r.data) r.release_conn() #最后释放这个HTTP连接

第五、使用wget

wget是一个从网络上自动下载文件的自由工具，跨平台软件。它支持HTTP，HTTPS和FTP协议，可以使用HTTP代理。这里使用Python的wget模块从一个URL下载文件。wget.download直接从地址url下载到本地localfile。需要使用pip命令安装后才能使用。

pip install wget

示例代码如下：

import wgeturl = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'wget.download(url,localfile)

除了使用 Python 编程语言，我们还可以使用命令行工具 wget 来下载文件。

下面是一个示例代码：

import osurl = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'os.system(f'wget -O {localfile} {url}')

第六、下载重定向的文件

有时我们下载一个链接文件，但是远端的服务器将URL会被重定向到另一个的源URL。遇到这种情况，使用requests.get可以轻松解决。get方法中，我们将allow_redirects设置为True，这将允许URL中的重定向，获得重定向后的内容后，然后二进制的方法保存文件内容。示例代码如下：

url = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'r = requests.get(url,timeout=300, allow_redirects=True)with open(localfile, "wb") as fp: fp.write(r.content)

下面介绍大文件的下载方法。

大文件的下载，需要使用文件流进行下载，它是一种更高效、更安全的方式。使用文件流进行下载的原理，就是将文件一块一块地按顺序从网络上读取，每读取一块就立即写入本地文件。这样的方法既可以保证安全可靠地下载大文件，又可以避免因内存不足而导致的程序崩溃。

第七、使用requests库中的get方法，下载大文件

使用requests库中的get方法，并将stream参数设置为True即可。

示例代码如下：

url = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'r = requests.get(url, stream=True)fp = open(localfile, "wb") for chunk in r.iter_content(chunk_size=1024): if chunk: fp.write(chunk) fp.flush()

第八、使用urllib2，下载大文件

需要说明的是，urllib2是Python2.7 自带的模块，示例代码只能在Python2.7运行。作为知识了解一下。示例代码如下：

url = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'r = urllib2.Request(url)u = urllib2.urlopen(r)with open('localfile, 'wb') as f: while True: tmp = u.read(1024) if not tmp: break f.write(tmp)

第九、使用urllib3，下载大文件

既然使用urllib2库可以下载文件，当然使用urllib3库也能办到。利用http连接池的request方法，并将preload_content参数设置为False即可。示例代码如下：

import urllib3 url = 'http://cv.sycdn.kuwo.cn/99d1a17cc43457c58cd0049db033c348/650e4bbc/resource/n1/17/37/233599851.mp3'localfile = './233599851.mp3'#创建一个HTTP连接池http = urllib3.PoolManager()r = http.request('GET', url, preload_content=False)chunk_size = 1024with open(localfile, 'wb') as out: while True: data = r.read(chunk_size) if not data: break out.write(data)r.release_conn() #最后释放这个HTTP连接

总结

通过介绍常见下载文件方法九个方面知识，我们可以轻松地实现 Python 下载文件的功能，同时也阐述了大文件下载的处理方法。当然，下载文件应该还有其他的方法，这里就不一一介绍。其中，使用 Requests 库是最为常用的方法，因为它提供了很多强大而灵活的功能，非常方便编写复杂的下载程序，这个也是我在项目中常用的方法。wget库下载功能强大，也是一个非常好的方法。

电脑装配网

Python 中常见下载文件方法九个方面知识

人阅读 | 作者lilintao | 时间：2023-10-14 05:31