使用合适的数据结构统计单词次数

Shihira 发布于2019-08-15 11:04 / 3383人阅读

摘要：序本文主要讲述一下如何使用的以及的的数据结构来统计单词次数。小结经过封装后的数据结构，用起来非常简洁。

序

本文主要讲述一下如何使用apache collections4的bag以及guava的multiset的数据结构来统计单词次数。

maven

        
            com.google.guava
            guava
            22.0
        
        
            org.apache.commons
            commons-collections4
            4.1

bag

    @Test
    public void testBag(){
        Bag bag = new HashBag<>();
        String content = "She is beautiful and she is my angel";
        Arrays.stream(content.split(" ")).forEach(word -> {
            bag.add(word);bag.add(word);
        });
        //get unique key
        Set set = bag.uniqueSet();
        set.stream().forEach(word -> {
            System.out.println(word + "-->" + bag.getCount(word));
        });
    }

multiset

    @Test
    public void testMultiSet(){
        String content = "She is beautiful and she is my angel";
        Multiset set = HashMultiset.create();
        Arrays.stream(content.split(" ")).forEach(word -> {
            set.add(word);
        });
        set.stream().distinct().forEach(e -> {
            System.out.println(e + "-->" + set.count(e));
        });
    }

小结

经过封装后的数据结构，用起来非常简洁。

GPU云服务器云服务器数据出现次数统计 java编写统计单词统计访问次数 linux统计次数

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/67519.html

大展身手的字典树

摘要：原文地址在简单字典树的实现一文中，我们以单词输入自动提示为引子，简单介绍了字典树的实现。前缀匹配本文讲述前缀匹配的字典树实现方案。在简单字典树的实现一文中，我们已经实现了字典树的基本操作，这里只需要再加上一个前缀匹配方法即可。原文地址在简单字典树(Trie)的实现一文中，我们以单词输入自动提示为引子，简单介绍了字典树的实现。那么，字典树到底可以用于哪些场合呢？前缀匹配：给定字典...

Anchorer 2019-07-24 17:36 评论0 收藏0
入门教程 | 5分钟从零构建第一个 Flink 应用

摘要：接着我们将数据流按照单词字段即号索引字段做分组，这里可以简单地使用方法，得到一个以单词为的数据流。得到的结果数据流，将每秒输出一次这秒内每个单词出现的次数。最后一件事就是将数据流打印到控制台，并开始执行最后的调用是启动实际作业所必需的。本文转载自 Jark’s Blog ，作者伍翀（云邪），Apache Flink Committer，阿里巴巴高级开发工程师。本文将从开发环境准备、创建 ...

Mike617 2019-05-22 19:16 评论0 收藏0