摘要:序本文主要讲述一下如何使用的以及的的数据结构来统计单词次数。小结经过封装后的数据结构,用起来非常简洁。
序
本文主要讲述一下如何使用apache collections4的bag以及guava的multiset的数据结构来统计单词次数。
mavenbagcom.google.guava guava 22.0 org.apache.commons commons-collections4 4.1
@Test public void testBag(){ Bagmultisetbag = new HashBag<>(); String content = "She is beautiful and she is my angel"; Arrays.stream(content.split(" ")).forEach(word -> { bag.add(word);bag.add(word); }); //get unique key Set set = bag.uniqueSet(); set.stream().forEach(word -> { System.out.println(word + "-->" + bag.getCount(word)); }); }
@Test public void testMultiSet(){ String content = "She is beautiful and she is my angel"; Multiset小结set = HashMultiset.create(); Arrays.stream(content.split(" ")).forEach(word -> { set.add(word); }); set.stream().distinct().forEach(e -> { System.out.println(e + "-->" + set.count(e)); }); }
经过封装后的数据结构,用起来非常简洁。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/67519.html
摘要:接着我们将数据流按照单词字段即号索引字段做分组,这里可以简单地使用方法,得到一个以单词为的数据流。得到的结果数据流,将每秒输出一次这秒内每个单词出现的次数。最后一件事就是将数据流打印到控制台,并开始执行最后的调用是启动实际作业所必需的。 本文转载自 Jark’s Blog ,作者伍翀(云邪),Apache Flink Committer,阿里巴巴高级开发工程师。 本文将从开发环境准备、创建 ...
阅读 884·2023-04-26 01:34
阅读 3315·2023-04-25 20:58
阅读 3148·2021-11-08 13:22
阅读 2077·2019-08-30 14:17
阅读 2469·2019-08-29 15:27
阅读 2625·2019-08-29 12:45
阅读 2936·2019-08-29 12:26
阅读 2773·2019-08-28 17:51