《大型网站系统与Java中间件》读书笔记（上）

baukh789 发布于2019-08-16 18:02 / 3038人阅读

摘要：另一个用户请求过来，负载均衡器指派这个请求到服务器。这样就平摊了请求这种方式就叫做轮询策略还有很多种，就看你想怎么实现了，反正这个逻辑的代码放在负载均衡器上。

前言

只有光头才能变强。

文本已收录至我的GitHub仓库，欢迎Star：https://github.com/ZhongFuCheng3y/3y

这本书买了一段时间了，之前在杭州没带过去，现在读完第三章，来做做笔记

这本书前三章都在科普和回顾中间件/分布式的基础，讲得非常通俗易懂。在之前已经我写过基础分布式相关文章，大家可以先去看看：

外行人都能看懂的SpringCloud，错过了血亏！

什么是ZooKeeper？

什么是消息队列？

什么是单点登录(SSO)

一、为什么分布式？

在之前的文章（外行人都能看懂的SpringCloud，错过了血亏！）也提过为什么要分布式：

模块之间独立，各做各的事，便于扩展，复用性高

高吞吐量。某个任务需要一个机器运行10个小时，将该任务用10台机器的分布式跑(将这个任务拆分成10个小任务)，可能2个小时就跑完了

在书上给出的观点：

升级单机的处理能力的性价比越来越低，单机的处理能力存在瓶颈

分布式系统更加稳定和可用（单机挂了就挂了，分布式挂了一般还有备用/不至于整个链路全挂）

1.1 大型网站架构演进过程

其实在没接触过分布式之前，在逛论坛的时候，经常会出现一些看起来很牛逼的词，诸如”读写分离“、”分库分表“、”主从架构“、”负载均衡“、”单点故障“等等名词，就觉得很高大上。下面我就稍微顺着”大型网站架构演进过程“来讲解一下这些词

在我们最开始接触Java项目的时候，一般来说是单机的（数据库、Web服务器都是同一台机器）

网站对外开放以后，访问量增大，服务器的压力也随之提高。此时，我们最简单的做法就是可以将数据库和应用分开，这样可以缓解一下当前系统的压力

应用服务器的压力继续增大，我们可以把应用服务器做成集群（说白了，就是加了台机器）

加了台应用服务器以后，就出现新的问题了：

用户请求的时候，走哪台服务器啊？

Session是依赖单台服务器的，那Session怎么搞？

解决用户走哪台服务器，我们就在用户请求到达应用服务器之前，加了一个”负载均衡器“，这个”负载均衡器“说白了就写了用户请求会到哪台应用服务器的逻辑

比如说，一个用户请求过来，负载均衡器指派这个请求到服务器A。另一个用户请求过来，负载均衡器指派这个请求到服务器B。这样就平摊了请求— 这种方式就叫做轮询

...策略还有很多种，就看你想怎么实现了，反正这个逻辑的代码放在负载均衡器上。

而Session的问题，我之前写什么是单点登录(SSO)已经讲过了，一般来说我们可以将Session保存在Redis上就行了。

随着业务的发展，我们的数据量和访问量都在增长，现在有不少的业务都是读多写少的，对于这种业务也是会直接反应到数据库上。

于是，我们可以增加一个读库。写入的操作走服务器C的MySQL，读取的操作走服务器D的MySQL。这样就实现了读写分离。

一般来说，我们的写库也叫做主库，读库也叫做从库，在互联网架构中，这叫做主从架构，比如常见的架构：一主多从（详细的参考资料：如何给老婆解释什么是 Master-Slave）

针对读多写少的业务，我们还有优化策略，引入搜索引擎和缓存。

搜索引擎也相当于一个读库，使用搜索引擎的倒排表方式，能够大大提升检索的速度

缓存则将热数据放入内存中，如果查询的数据在缓存中存在，则直接返回

搜索引擎和缓存的参考资料：

Redis合集

什么是Lucene

Elasticsearch入门

注：这里说的索引和缓存就未必特指ES和Redis，比如缓存我也可以用本地缓存而不一定是Redis的。这里用Redis和ES只是我画图方便。

继读写分离之后，数据库还是遇到了瓶颈，此时我们就可以采用分库分表策略了：

垂直拆分— 不同的业务数据分到不同的数据库

水平拆分— 将同一张表的数据拆分到不同的数据库中（原因是这张表的数据量/更新量太大了）

注：单表行数超过500万行或者单表容量超过2GB才推荐进行分库分表(如果预计三年都达不到这个数据量，不要在创建表的时候就分库分表!) —《阿里巴巴 Java开发手册》

在数据存储方面，除了关系型数据库之外，如果有别的业务场景，可能还需要引入分布式存储系统

分布式文件系统

分布式Key-Value系统

分布式数据库

数据库问题解决之后，应用也面临着挑战（应用的功能会越做越多，应用也随之越做越大），为了不让应用持续变大，这就需要把应用拆开，从一个应用变为两个/多个应用。

不同功能/模块之间的调用不再单纯通过本机调用，引入了远程的服务调用。

某个应用只有一台机器上运行着，如果这台机器上出现了问题，导致这个应用无法运行，这就叫单点故障。

最后

这本书《大型网站系统与Java中间件》的前三章主要是铺垫什么是中间件、什么是分布式(从单机演进到分布式的过程)以及讲述了网站的架构演进过程，剩下的是回顾一些基础。比如说：

bio/nio/aio

HTTP/Session

JVM

Java多线程以及并发的基础知识

JUC包下的常见类

这些我都曾经多多少少都做过笔记，不妨在我的公众号下找找相关的文章。总的来说，还是读得很过瘾的！后面读完下面的章节，我会继续分享，敬请期待。

乐于输出干货的Java技术公众号：Java3y。公众号内有200多篇原创技术文章、海量视频资源、精美脑图，关注即可获取！

觉得我的文章写得不错，点赞！

GPU云服务器云服务器读书笔记编程思想读书笔记大数据时代读书笔记大型网站系统

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/74908.html

《大型网站系统与Java中间件》读书笔记（中）

摘要：文本已收录至我的仓库，欢迎回顾上一篇大型网站系统与中间件读书笔记一这周周末读了第四章，现在过来做做笔记，希望能帮助到大家。没错，我们通过肯定是可以完成两个系统之间的通信的问题的。前言只有光头才能变强。文本已收录至我的GitHub仓库，欢迎Star：https://github.com/ZhongFuCheng3y/3y 回顾上一篇：《大型网站系统与Java中间件》读书笔记（一）...

fredshare 2019-08-16 18:27 评论0 收藏0
那些年我看过的书 —— 致敬我的大学生活 —— Say Good Bye ！

摘要：开头正式开启我入职的里程，现在已是工作了一个星期了，这个星期算是我入职的过渡期，算是知道了学校生活和工作的差距了，总之，尽快习惯这种生活吧。当时是看的廖雪峰的博客自己也用做爬虫写过几篇博客，不过有些是在前人的基础上写的。 showImg(https://segmentfault.com/img/remote/1460000010867984); 开头 2017.08.21 正式开启我...

xiaoqibTn 2019-08-16 10:40 评论0 收藏0
［读书笔记］大型分布式网站架构设计与实践.分布式缓存

摘要：接下来将介绍分布式缓存的典型代表，以及分布式缓存的应用场景。的分布式实现本身并不是一种分布式的缓存系统，它的分布式是由访问它的客户端来实现的。前言：本书是对分布式系统架构涉及到的相关技术的一本科普书籍。由于很难作为开发参考，只能但求了解。所以通篇浅读，对分布式系统进行大致的了解。因为写的非常好，感觉非常有意思，自己也做不出总结。所谓的读书笔记也就演变成了摘抄。简介一个大型、稳健、...

pepperwang 2019-08-06 13:25 评论0 收藏0
好书共读 | 国内外互联网技术大牛们都写了哪些书籍?

摘要：本项目主要收集国内外各大互联网公司技术大牛们出版的值得一看的书籍，欢迎推荐书籍完善内容和排版。逆流而上阿里巴巴技术成长之路阿里巴巴集团成长集编委会总结阿里巴巴技术团队在基础架构中间件数据库业务开发等领域的经典实践以及对未来的思考。出自 GitHub 开源组织 Doocs源地址：https://github.com/doocs/tech... 后面将会在 GitHub 陆续更新书籍清...

goji 2019-06-24 18:24 评论0 收藏0