快生活 - 生活常识大全

流量为王程序员如何打破秒原则技术


  对于一个 Web 站点或是一个 APP 应用来说,当用户打开你的站点时,最在乎的并不是你提供的内容有多么的吸引人、内容质量有多么高,因为此时用户还没看见你的提供的内容,那么用户最在乎的是什么呢?是你站点加载速度和访问速度。
  有研究表明,大多数用户期望的网站加载时间是3秒,如果时间长过3秒,就会始流失57%的用户。如果超过8秒,几乎所有用户会毫不犹豫的离开你的网站,这就是所谓的8秒原则。
  随着技术的日新月异,Web2.0的到来大大提高了网站与网民间之间的互动,可以提供直播、视频、图片等等多媒体方式,因此诞生了许多优秀的门户网站与企业网站。但是同时也带来了很多问题,其中最大的问题就是网站访问速度的问题,这个问题直接影响到网站的流量。
  众所周知,互联网时代是一个流量为王的时代,谁掌握了流量谁就能赚钱。那么如何解决网站访问慢的问题呢?
  要解决网站为什么访问慢,我们得了解,是什么原因会导致网络访问变慢,我总结下主要有以下几点:
  链路问题;
  不同运营商之间互相访问;
  DNS 解析问题;
  服务器系统存在瓶颈导致差导致的访问慢;
  程序问题的访问慢。
  链路问题
  举个例子,假设杭州的一个网友小李,他通过手机访问一家图片类的网站,但是这家网站的服务器是在北京,如图所示:
  他怎么访问到这台服务器的呢?首先,小李从他的设备打开浏览器访问对应的网站,此时数据就会从网卡将请求发出去,假设小李从客户端连接的是WiFi,就会首先从WiFi对应的路由器将数据转发出去,然后经过运营商的网络,这中间会经过很多个大大小小的路由设备,最终将数据传递到对应的网站服务器,如图所示:
  这就好比你从杭州买个高铁票到北京,中间经过很多个站点,比如上海站、山东站等,这一个一个的站点就可以理解为一个一个的路由器。需要注意的是,上图所示的只是客户端将数据发送给服务器的过程,那么服务器收到数据之后就会与客户端建立经典的TCP 握手,也就是收到客户端发送的SYN标志位,然后会回复客户端SYN+ACK,此时数据又从服务器对应的机房出口路由器一层一层的返回给客户端。一来一回,你是不是感觉这个过程很慢,事实上这确实是比较慢。但是网络的传输速度还是比现实中坐高铁快得多的,所以这个过程可能也就需要几秒的时间。
  众所周知,2个不同路由器下的设备如果要进行通信,就必须要需要使用 IP 地址,在IPV4协议的报头中有一个字段叫 TTL ,即Time To Live的缩写,该字段指定IP包被路由器丢弃之前允许通过的最大网段数量。TTL的最大值是255,一般推荐值是64。这个值越大说明经过的路由越多,延迟也就越大。
  在IP数据包从源到目的的整个转发路径上,每经过一个路由器,路由器都会修改这个TTL字段值,具体的做法是把TTL的值减1,然后再将IP包转发出去。如果在IP包到达目的IP之前,TTL减少为0,路由器将会丢弃收到的TTL=0的IP包并向IP包的发送者发送 ICMP time exceeded消息。
  比如我们要 ping 百度 从下面就可以看到 ttl 等于 54:
  #pingwww.baidu.com
  PINGwww.a.shifen.com(180.97.33.107)56(84)bytesofdata.
  64bytesfrom180.97.33.107(180.97.33.107):icmp_seq=1ttl=54time=12.4ms
  64bytesfrom180.97.33.107(180.97.33.107):icmp_seq=2ttl=54time=12.2ms
  64bytesfrom180.97.33.107(180.97.33.107):icmp_seq=3ttl=54time=12.0ms
  64bytesfrom180.97.33.107(180.97.33.107):icmp_seq=4ttl=54time=11.9ms
  不过,如果客户端在请求时,中间某个路由器设备或网络线路出现故障,那么就无法正常建立连接了。这个时候就会出现丢包,如果丢包率达到100%,就说明这个网站是完全无法访问,我们可以通过 mtr 或traceroute 等命令来确认从客户端到达目标网络中间链路是否丢包是否延迟很大。
  其中的Loss% 列如果对应的行出现丢包率 100% 就说明该行对应的IP 地址所在的路由设备出现问题,从而导致无法继续将数据转发出去了。
  Keys:HelpDisplaymodeRestartstatisticsOrderoffieldsquit
  PacketsPings
  HostLoss%SntLastAvgBestWrstStDev
  1.???
  2.10.206.48.650.0%3601.31.41.03.30.2
  3.115.238.120.1490.0%3601.41.91.010.70.7
  4.115.238.120.1010.0%3601.61.71.111.21.0
  5.220.191.200.2430.0%3605.46.35.0105.57.0
  6.202.97.33.16136.5%36016.217.712.0311.634.1
  7.202.102.73.1500.0%36015.422.613.8220.322.7
  8.???
  9.180.97.32.102100.0%36024.730.314.391.116.8
  10.???
  不同运营商之间互相访问
  还有一种情况就是不同运营商的网络之间访问也会导致访问延迟变大,从而导致请求丢包或连接被拒绝。
  在国内,不同运营商之间的网络走的线路是不一样的,假设小李是使用的中国移动的网络,而他访问的目标网站是一个中国联通的服务器,由于存在这种问题就会导致请求变得非常慢或直接无法访问。
  要解决这个问题就是服务器选择BGP(边界网关协议,Border Gateway Protocol)线路的机房, BGP是互联网上一个核心的去中心化自治路由协议,它可以很好地解决不同运营商之间的访问延迟大等问题。
  DNS 解析问题
  不同的DNS 服务器解析得到的 IP 结果是不一样的。一般情况下,如果不主动配置,运营商会默认给客户端分配一些运营商自己的 DNS 服务器,这些服务器由于更新缓存慢,也会导致无法访问等情况出现。因此建议客户端配置公共的 DNS 服务器,例如 114.114.114 等DNS地址。
  服务器本身性能问题
  如果服务器的访问量过大,就会导致系统 CPU、内存、磁盘I/O、网络I/O飙高,也会导致请求被中断,从而无法正常请求无法被处理从而导致报错,例如 HTTP 报 5XX 的错误。
  应用本身问题
  如果一个网站服务器存在大量的图片则会导致浏览器加载变慢,从而导致访问慢,另外一些html文件或js css文件没有经过压缩也会导致文件变大,从而导致加载时间变长,亦或者程序的某个方法写的有问题导致请求时间过长等等。
  我们可以通过例如Chrome等浏览器的开发者模式来确认到底是那些文件加载时间过长,从而针对性的进行优化。
  如何优化?
  那么怎么优化呢?首先,可以通过配置 Web 服务器的缓存规则来实现对一些静态资源进行缓存,从而达到快速访问的效果。例如 nginx 中通过如下配置,实现将制定的文件进行缓存 30天。
  location~.*.(gif|jpg|jpeg|png|bmp|swf)$
  {
  expires30d;
  }
  location~.*.(js|css)?$
  {
  expires30d;
  }
  当文件被缓存后,请求就不会直接去磁盘获取文件,从而减小 I/O 资源的消耗。
  其次,可以配合 CDN 来实现加速,CDN 全称是Content Delivery Network,即内容分发网络。
  CDN是构建在网络之上的内容分发网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度、缓存等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。使用 CDN 可以大大降低客户端到达服务器的网络延迟。
  另外,对系统进行监控,判断瓶颈在哪里并进行必要的升级或水平扩容,从而达到降低系统负载。
  此外,服务端如果有多台服务器,也可以针对不同运营商的请求使用 DNS 分发到不同的区域或不同的运营商从而达到降低负载以及解决不同运营商之间访问慢的问题。
  最后,可以对应用程序本身进行检查,比如是否是哪个方法或调用出现问题导致的访问变慢。
  作为码一代,想教码二代却无从下手:
  听说少儿编程很火,可它有哪些好处呢?
  孩子多大开始学习比较好呢?又该如何学习呢?
  最新的编程教育政策又有哪些呢?
网站目录投稿:翠雪