news 2026/4/18 8:09:38

317. Java Stream API - 使用 groupingBy() 构建直方图并提取最大值

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
317. Java Stream API - 使用 groupingBy() 构建直方图并提取最大值

文章目录

  • 317. Java Stream API - 使用 `groupingBy()` 构建直方图并提取最大值
      • ✅ Part 1:构建直方图(Histogram)
      • ✅ Part 2:提取最大值(提取出现次数最多的字符串长度)
        • 📌 方法一:用 `Map.Entry` 直接找最大值
      • ⚠️ Part 3:多个最大值时如何处理?
      • ✅ Part 4:如何提取所有最大值(Map 反转技巧)
    • ✅ 总结

317. Java Stream API - 使用groupingBy()构建直方图并提取最大值

✅ Part 1:构建直方图(Histogram)

我们有一个字符串列表,想要统计每种字符串长度的出现次数。这个任务可以通过Collectors.groupingBy配合Collectors.counting()来完成:

Collection<String>strings=List.of("one","two","three","four","five","six","seven","eight","nine","ten","eleven","twelve");Map<Integer,Long>histogram=strings.stream().collect(Collectors.groupingBy(String::length,Collectors.counting()));histogram.forEach((length,count)->System.out.println(length+" :: "+count));

🖨 输出:

3::44::35::36::2

🔍 说明:

  • String::length是分组键:字符串的长度。
  • Collectors.counting()是统计该组中元素的数量。
  • 最终结果是一个直方图:键是字符串长度,值是该长度出现的次数。

✅ Part 2:提取最大值(提取出现次数最多的字符串长度)

📌 方法一:用Map.Entry直接找最大值

我们想要从直方图中找到数量最多的那组。例如上面例子中,3 :: 4是数量最多的(长度为3的字符串有4个)。

Map.Entry<Integer,Long>maxValue=histogram.entrySet().stream().max(Map.Entry.comparingByValue()).orElseThrow();System.out.println("maxValue = "+maxValue);

🖨 输出:

maxValue=3=4

📌 小技巧:

  • entrySet().stream()是将 Map 转换为流。
  • Map.Entry.comparingByValue()是基于值的比较器。
  • orElseThrow()是保险措施,避免空结果。

⚠️ Part 3:多个最大值时如何处理?

如果出现多个 key 拥有相同的最大 value,那么上面方法只能选出一个,其他会被忽略。例如:

Collection<String>strings=List.of("two","three","four","five","six","seven","eight","nine","ten","eleven","twelve");

输出的直方图:

3::34::35::36::2

👀 问题:有三个长度(3、4、5)的字符串数量都是 3。

如果你用.max(),只会返回其中之一,可能会遗漏其他候选最大值。


✅ Part 4:如何提取所有最大值(Map 反转技巧)

🎯 思路: 我们可以将直方图反转,把 “数量” 作为 key,“长度” 作为 value(或 List of value):

Map<Long,List<Integer>>reversed=histogram.entrySet().stream().collect(Collectors.groupingBy(Map.Entry::getValue,// 用 count 作为 keyCollectors.mapping(Map.Entry::getKey,// 收集 lengthCollectors.toList())));

然后找出最大 key,对应的 List 就是所有最大值:

LongmaxCount=reversed.keySet().stream().max(Long::compare).orElseThrow();List<Integer>lengthsWithMaxCount=reversed.get(maxCount);System.out.println("最大数量 = "+maxCount+",对应长度 = "+lengthsWithMaxCount);

🖨 输出:

最大数量=3,对应长度=[3,4,5]

✅ 总结

操作目标推荐方法
构建直方图(统计数量)groupingBy(..., counting())
提取唯一最大值(value 最大)entrySet().stream().max(comparingByValue())
提取多个最大值(存在并列最大)Map 反转 +groupingBy+max(keySet())
提升可读性使用 Java 16+ 的record
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 19:48:17

2026年新手小白部署Openclaw(clawdbot)AI助手保姆级步骤教程

2026年新手小白部署Openclaw&#xff08;clawdbot&#xff09;AI助手保姆级步骤教程&#xff01;OpenClaw&#xff08;Clawdbot&#xff09;是什么&#xff1f;OpenClaw&#xff08;原Clawdbot/Moltbot&#xff09;是一个开源的AI智能体平台&#xff0c;凭借其强大的任务自动化…

作者头像 李华
网站建设 2026/4/18 3:57:59

开源编程模型NousCoder-14B技术解析与未来挑战

开源编程模型NousCoder-14B技术解析与未来挑战 开源人工智能初创公司Nous Research于本周一发布了一款新的竞争性编程模型。据称&#xff0c;该模型仅使用48个某中心最新B200图形处理器&#xff0c;在四天内完成训练&#xff0c;其性能可匹敌或超越多个更大的专有系统。 该模…

作者头像 李华
网站建设 2026/4/18 1:40:40

2026更新版!9个降AI率平台测评:本科生降AI率必看攻略

在当前高校论文写作中&#xff0c;AI生成内容的痕迹越来越明显&#xff0c;而如何有效降低AIGC率、去除AI痕迹、同时保持文章语义通顺&#xff0c;已成为本科生必须面对的难题。随着学术规范日益严格&#xff0c;许多高校开始引入AI检测系统&#xff0c;这对依赖AI辅助写作的学…

作者头像 李华
网站建设 2026/4/3 3:44:59

all-MiniLM-L6-v2实战案例:从零搭建文档相似度比对系统(含WebUI)

all-MiniLM-L6-v2实战案例&#xff1a;从零搭建文档相似度比对系统&#xff08;含WebUI&#xff09; 1. 为什么你需要一个轻量又靠谱的语义比对工具&#xff1f; 你有没有遇到过这些情况&#xff1a; 客服团队每天要处理上百条用户提问&#xff0c;但很多问题只是换了个说法…

作者头像 李华
网站建设 2026/3/15 22:07:01

Ollama部署ChatGLM3-6B-128K:支持RAG增强的长文本问答系统搭建指南

Ollama部署ChatGLM3-6B-128K&#xff1a;支持RAG增强的长文本问答系统搭建指南 1. 为什么需要ChatGLM3-6B-128K这样的长文本模型 你有没有遇到过这样的问题&#xff1a;手头有一份50页的技术白皮书、一份上万字的合同草案&#xff0c;或者几十页的产品需求文档&#xff0c;想…

作者头像 李华