293. Java Stream API - 从 HTTP 源创建 Stream-程序员充电站

文章目录

293. Java Stream API - 从 HTTP 源创建 Stream
- - 🎯 核心概念
  - 📌 示例：从 HTTP 响应体创建流
  - 📌 代码解析
  - 📌 适用场景
  - 📌 性能考虑
  - 📌 总结

293. Java Stream API - 从 HTTP 源创建 Stream

🎯 核心概念

在Java 11中，HTTP Client API引入了一种通过流处理HTTP响应体的方法。这种方式可以让你高效地处理大体积数据，而无需一次性将整个响应体加载到内存中。通过这种方式，你可以像处理文件一样逐行读取HTTP响应体。

📌 示例：从 HTTP 响应体创建流

假设你想要处理《双城记》（A Tale of Two Cities）这本书的文本，书本内容可以通过古腾堡计划在线获取。我们需要从中去掉头部和尾部信息，只提取正文部分。

以下是从 HTTP 源获取文本并创建流的完整示例：

// URI 指向文件地址URIuri=URI.create("https://www.gutenberg.org/files/98/98-0.txt");// 创建 HTTP 请求HttpClientclient=HttpClient.newHttpClient();HttpRequestrequest=HttpRequest.newBuilder(uri).build();// 发送请求并获取响应体作为行流（Stream<String>）HttpResponse<Stream<String>>response=client.send(request,HttpResponse.BodyHandlers.ofLines());List<String>lines;try(Stream<String>stream=response.body()){lines=stream.dropWhile(line->!line.equals("A TALE OF TWO CITIES"))// 跳过头部信息.takeWhile(line->!line.equals("*** END OF THE PROJECT GUTENBERG EBOOK A TALE OF TWO CITIES ***"))// 跳过尾部信息.collect(Collectors.toList());// 将正文部分收集到列表中}System.out.println("# lines = "+lines.size());// 输出处理后的行数

🧾输出结果：

# lines=15904

📌 代码解析

创建URI和HTTP请求：首先，我们使用URI.create()方法创建指向文件的 URI，然后用HttpClient.newHttpClient()创建 HTTP 客户端，并构建一个HTTP请求。
发送请求并获取响应体：使用client.send(request, HttpResponse.BodyHandlers.ofLines())发送请求，并通过BodyHandlers.ofLines()方法获取 HTTP 响应体的行流。这种方式返回的是Stream<String>，意味着你可以像处理普通的文本文件一样处理响应体。
流操作：
- dropWhile()：跳过文件中直到找到《双城记》标题的部分，排除掉头部信息。
- takeWhile()：继续获取直到找到结尾的标记为止，排除掉尾部信息。
- collect(Collectors.toList())：将结果收集到列表中（在这个示例中，我们将正文的每一行保存为列表项）。
高效内存管理：由于我们使用了Stream，响应体的内容是逐行处理的，这样可以避免将整个文本加载到内存中，对于处理大文件非常有利。

📌 适用场景

这种从 HTTP 响应体创建流的方式非常适用于以下场景：

大文件的高效处理：当你需要从服务器下载并处理大文本文件（如日志文件、大型书籍等）时，逐行读取数据比将整个文件加载到内存中更加节省内存，避免了内存溢出的风险。
流式处理：适用于实时处理和流式数据的场景，尤其是在处理大规模响应数据时（例如日志分析或实时数据流）。

📌 性能考虑

内存效率：与直接将响应体存储到内存中的做法相比，逐行处理可以极大地减少内存消耗，尤其在处理大文件时尤为重要。
延迟控制：通过流处理，可以更灵活地控制数据的处理节奏。例如，你不需要一次性加载所有数据，可以随时对流中的数据进行过滤、转换等操作。

📌 总结

HTTP Client API（自 JDK 11）为我们提供了处理 HTTP 响应的强大功能。通过HttpResponse.BodyHandlers.ofLines()，我们可以创建一个逐行处理响应体的流。
这种方式非常适合于需要从网络获取并处理大量数据的场景，特别是在内存受限的情况下，能够提高应用程序的性能和稳定性。
我们演示了如何去掉文件的头部和尾部信息，仅保留正文内容，进行流式处理。

高频率ISR处理优化：降低CPU开销的操作指南

高频率ISR处理优化：如何让CPU从“中断风暴”中解脱？你有没有遇到过这样的场景？系统里一个50kHz的定时器中断，每次触发只执行几十条指令，但CPU占用率却飙升到90%以上，主循环几乎跑不动，通信任务频…

李华

PubMed文献批量下载终极指南：3分钟搞定100篇文献

PubMed文献批量下载终极指南：3分钟搞定100篇文献【免费下载链接】Pubmed-Batch-Download Batch download articles based on PMID (Pubmed ID) 项目地址: https://gitcode.com/gh_mirrors/pu/Pubmed-Batch-Download 在科研工作中，文献获取是每个…

李华

BabelDOC专业PDF翻译工具完全使用手册

BabelDOC专业PDF翻译工具完全使用手册【免费下载链接】BabelDOC Yet Another Document Translator 项目地址: https://gitcode.com/GitHub_Trending/ba/BabelDOC BabelDOC作为一款专注于学术文档翻译的智能工具，在科研论文、技术报告等专业PDF文档处理方面表…

李华

Jasminum终极指南：5分钟搞定Zotero中文文献管理

Jasminum终极指南：5分钟搞定Zotero中文文献管理【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件，用于识别中文元数据项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 还在为Zotero无法准确…

李华

DeepSeek-R1-Distill-Qwen-1.5B部署：自动扩缩容策略

DeepSeek-R1-Distill-Qwen-1.5B部署：自动扩缩容策略 1. 引言随着大模型在实际业务场景中的广泛应用，如何高效部署轻量化模型并实现资源的动态调度成为工程落地的关键挑战。DeepSeek-R1-Distill-Qwen-1.5B作为一款基于知识蒸馏技术优化的1.5B级别小模型…

李华

5分钟掌握网页内容解锁工具：免费访问付费内容的终极指南 [特殊字符]

5分钟掌握网页内容解锁工具：免费访问付费内容的终极指南 🔓 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在当今信息爆炸的时代，你是否经常遇到这…

李华