资讯专栏INFORMATION COLUMN

使用合适的数据结构统计单词次数

Shihira / 3179人阅读

摘要:序本文主要讲述一下如何使用的以及的的数据结构来统计单词次数。小结经过封装后的数据结构,用起来非常简洁。

本文主要讲述一下如何使用apache collections4的bag以及guava的multiset的数据结构来统计单词次数。

maven
        
            com.google.guava
            guava
            22.0
        
        
            org.apache.commons
            commons-collections4
            4.1
        
bag
    @Test
    public void testBag(){
        Bag bag = new HashBag<>();
        String content = "She is beautiful and she is my angel";
        Arrays.stream(content.split(" ")).forEach(word -> {
            bag.add(word);bag.add(word);
        });
        //get unique key
        Set set = bag.uniqueSet();
        set.stream().forEach(word -> {
            System.out.println(word + "-->" + bag.getCount(word));
        });
    }
multiset
    @Test
    public void testMultiSet(){
        String content = "She is beautiful and she is my angel";
        Multiset set = HashMultiset.create();
        Arrays.stream(content.split(" ")).forEach(word -> {
            set.add(word);
        });
        set.stream().distinct().forEach(e -> {
            System.out.println(e + "-->" + set.count(e));
        });
    }
小结

经过封装后的数据结构,用起来非常简洁。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/67519.html

相关文章

  • 大展身手字典树

    摘要:原文地址在简单字典树的实现一文中,我们以单词输入自动提示为引子,简单介绍了字典树的实现。前缀匹配本文讲述前缀匹配的字典树实现方案。在简单字典树的实现一文中,我们已经实现了字典树的基本操作,这里只需要再加上一个前缀匹配方法即可。 原文地址 在简单字典树(Trie)的实现一文中,我们以单词输入自动提示为引子,简单介绍了字典树的实现。那么,字典树到底可以用于哪些场合呢? 前缀匹配:给定字典...

    Anchorer 评论0 收藏0
  • 入门教程 | 5分钟从零构建第一个 Flink 应用

    摘要:接着我们将数据流按照单词字段即号索引字段做分组,这里可以简单地使用方法,得到一个以单词为的数据流。得到的结果数据流,将每秒输出一次这秒内每个单词出现的次数。最后一件事就是将数据流打印到控制台,并开始执行最后的调用是启动实际作业所必需的。 本文转载自 Jark’s Blog ,作者伍翀(云邪),Apache Flink Committer,阿里巴巴高级开发工程师。 本文将从开发环境准备、创建 ...

    Mike617 评论0 收藏0

发表评论

0条评论

Shihira

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<