10 个例子展示为什么 cURL 是一个很棒的命令行工具
无论你是开发者、DevOps 工程师、系统管理员、QA 还是其他技术岗位,你一定对 cURL 很熟悉——用于通过 URL 传输数据的命令行工具和库。
然而,大多数时候,我们都只用 curl
来做一些简单的任务,比如下载文件或检查网站是否可访问,但 curl
能做的远不止这些!
在这篇文章中,我们将介绍一些很酷的例子和技巧,展示为什么 curl
是一个非常棒且被低估的工具……
文件名代换
首先介绍的是文件名代换,它允许我们用一个 curl
命令发出多个请求:
1 | $ curl -s "https://jsonplaceholder.typicode.com/users/[1-3]" | jq -s . |
前两个命令展示了如何运行一系列请求——第一个命令会产生对 .../users/1
、.../users/2
和 .../users/3
的请求,而另一个使用步长选项,产生 2、4、6、8 和 10 的请求。考虑到这些特定请求返回的是 JSON,我们还将它与 jq ...
和 -s
(slurp)操作符结合,将单个请求的响应合并为一个数组。
第三个例子使用了特定数字的列表而不是范围,这也适用于字符和单词。例如,我们可以使用 globbing 发出带有多种协议的请求:{http,https}://...
最后一个例子将 globbing 与输出变量结合,文件名中的 #1
变量指的是范围 [1-3]
。这将生成 file_1.json
、file_2.json
和 file_3.json
。
配置文件
大多数时候,使用 curl
时我们可能希望传递相同的命令行选项,如代理设置、请求超时、头信息等。这时名为 .curlrc
的 curl
配置文件可能会派上用场:
1 | # ~/.curlrc |
这只是一个文本文件,每行代表一个将传递给 curl
的选项。它会自动从 ~/.curlrc
读取,所以你不需要任何额外的标志,但你可以使用 -K
来覆盖或指定不同的位置,例如:
1 | $ curl -K .curlrc https://google.com |
类似于标志和选项,有时我们也希望传递凭据。这可以通过 --user
选项来完成,但这会将凭据留在 Shell
历史记录中,所以我们可以利用 curl
支持的 .netrc
文件:
1 | # ~/.netrc |
格式包括 machine
(URL)、login
和 password
。它们可以在一行中或如上所示,并且我们可以在一个文件中有多个。要使用它,只需将其传递给 curl
:
1 | $ curl --netrc-file .netrc https://authenticationtest.com/HTTPAuth/ |
并行请求
我们已经在 文件名代换部分
讨论了请求的范围,但并行化呢?好吧,curl
也能做到:
1 | $ curl -I --parallel --parallel-immediate --parallel-max 3 --config websites.txt |
我们需要做的只是添加 --parallel
(或 -Z
),curl
将打开最多 50 个并行连接(可以通过 --parallel-max N
更改)。
还要注意我们是如何提供 URL 的,第一种方法是通过 --config
参数和一个文本文件,看起来像这样:
1 | url = "stackoverflow.com" |
另一个方法是将所有 URL 放在命令行上。这两个选项也适用于非并行请求!
格式化和变量
curl
可以输出很多东西,有时会让人不知所措、冗长且不必要。幸运的是,我们可以使用输出格式化只打印我们感兴趣的内容:
1 | $ curl --silent --output /dev/null --show-error -w @format.txt http://example.com/ |
我们通过使用 -w
选项并传递一个格式文件来实现这一点。要生成上述输出,可以使用:
1 | # format.txt |
每个变量都用 %{...}
包围。它们可以是简单变量,如 response_code
,也可以是 url.<NAME>
的一部分,指的是 URL 组件,如主机或端口。最后,我们还可以使用 %header{HEADER_NAME}
变量输出响应头信息。
格式化的一个很好的用途是测量请求/响应时间,可以用以下格式来实现:
1 | # format.txt |
有关完整的变量列表,请参阅 文档。
测试与故障排除
使用 curl
最常见的方式是进行(网络)故障排除。通常只需对特定 URL 发出请求即可提供足够的信息,但我们可以做更多的事情,例如我们可以强制使用特定的本地网络接口:
1 | $ ip link show |
同样,我们可以强制使用特定的 DNS 服务器:
1 | $ curl --dns-ipv4-addr 1.1.1.1 https://example.com |
或者我们可以测试超时并捕获退出代码(退出代码):
1 | curl --connect-timeout 30 --silent --output /dev/null \ |
这对测试代理服务器是否正常工作非常有用(使用 -x http://proxy.example.com:80
)。
Trurl
curl
不只是一个 CLI 工具——该项目还包括 libcurl
以及 trurl
,我想在这里展示一下。
trurl 是一个用于解析 URL 的专用工具,是 curl
的兄弟项目。可以从源代码安装:
1 | $ sudo apt-get install libcurl4-openssl-dev |
这里有几个使用它的例子:
1 | $ trurl --url https://example.com/some/path/to/file.html --get '{path}' |
第一个例子展示了如何提取 URL 组件,这里是路径,但也可以是如 url、scheme、user、password、options 或 host 等。
第二个例子使用 append
功能,向 URL 添加查询参数。
最后一个例子展示了 --json
选项,它将解析的 URL 输出为 JSON,非常适合进一步处理。
trurl
可以做更多事情,你可以查看 这个视频 或 手册(底部有例子)。
发送/上传数据
大多数时候我们使用 curl
下载或请求数据,但它(显然)也可以发送数据。用 curl
发送 POST 数据并不是什么新鲜事,对吧?
1 | $ curl -X POST "https://httpbin.org/post" -H "accept: application/json" --json '{"key": "value"}' |
但这样发送 JSON,需要在单引号和双引号之间切换,很快就会变得很烦人,但有一个更好的方法:
1 | $ jo -p key=value | curl -X POST "https://httpbin.org/post" -H "accept: application/json" --json @- |
我想我们都熟悉用 jq
解析 curl
的 JSON 输出,但反过来呢?
上面我们使用 jo
工具,它可以轻松创建 JSON,然后我们可以使用 --json
选项将其传递给 curl
。
当然,--json
选项也可以从文件中读取输入,例如使用 --json @data.json
。
协议
最后但同样重要的是协议 —— 通常我们只会使用 HTTP 或 HTTPS,但 curl
支持 很多协议。
我特别想提到一个是 telnet
,它对于测试服务器是否监听特定端口很有用,但如果你在一台没有安装也不能安装 telnet
的服务器/机器上怎么办?只需使用 curl
:
1 | # 同 telnet example.com 1234 |
一些更为冷门(有趣)的协议选项是用于电子邮件的 IMAP、POP3 和 SMTP,这意味着你可以使用 curl
阅读和发送电子邮件。要阅读它们:
1 | $ curl --url "imaps://imap.gmail.com:993/Inbox;UID=1" --user "[email protected]:PASSWORD" |
要使其在 GMail 上工作,你需要创建 应用密码,这比正常密码更不安全。如果你真的想尝试这个,请查看 Gmail IMAP 文档 和 这些查询 以获取灵感。
要发送电子邮件,你可以使用:
1 | $ curl smtp://mail.example.com \ |
这里的 message.txt
是实际的电子邮件,需要遵循特定格式,请查看 这个页面 了解示例。
结论
我们到了最后,我很确定这些例子至少有 10 个(我停止计数了)。但老实说,这只是冰山一角——我们甚至没有触及 curl
的重要级成部分 libcurl
。
curl
可以做的事情还有很多,所以我推荐你去探索 文档 和 https://everything.curl.dev/。
本文翻译自:「 Martin Heinz 」,原文:https://martinheinz.dev/blog/113 ,版权归原作者所有。