最近开始研究Nginx配置,哎~现在出去面试机会都会问到,不学不行了,先从简单的开始吧,这两天研究张宴的博客,自己也做了一次配置,分享一下。

    概述:反向代理是指的,服务器代理网络上的客户机请求,将请求转达给内部真实服务器,然后在返回给Internet客户端,代理服务器上面没有任何网页资料。反向代理和正向代理没有冲突,可以在防火墙设备中同时使用这两种结合,正向代理可以进行过滤,保护内部网络安全。

               软件七层负载均衡大多是基于HTTP反向代理,Nginx反向代理能够支持虚拟主机,可以按照轮询,IP哈希,URL哈希,权重方式对后端服务器做负载均衡,还支持后端服务器健康检查。

   常见的Web负载均衡方法:

                                                     1、 DNS轮询:将同一个主机名添加多个A记录,DNS将解析请求安装A记录的顺序,随即分配到不同的IP上,使用dig baidu.com 就可以看到不同的A记录对应的IP地址。缺点:可靠性低,其中一台出现故障,就不会给予回应,就算从DNS去掉该服务器IP,但是也会保存在各地区的ISP众多的DNS缓存中。系统股灾不均衡,使用简单轮询,不能计算出服务器的负载差异,所以有可能客户集中请求到其中某一台服务器。

                                                   2、F5、LVS、DNS只能解析这里不做讲述

配置环境:

三台CentOS5.3,一台做nginx代理,2台apache做页面测试。apache端口改为:8080,nginx使用80口接收客户请求

yum -y install pcre-devel openssl openssl-devel                   //安装包,否则编译时候出错

#useradd  www

#groupadd  www

#usermod -g www www         //设置nginx的用户和组

#tar  xzvf  pcre-7.8.tar.gz

#./configure

#make ; make install                //安装pcre让nginx支持rewrite重写方便以后所需

[root@localhost tar]# cd nginx-0.7.16/

[root@localhost nginx-0.7.16]# ./configure  --user=www --group=www --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_ssl_module

 --with-http_stub_status_module:这个模块用于获取nginx自上次启动以来的工作状态,非核心模块

--with-http_ssl_module               : 把ssl编译进去, 仅仅指定openssl库的源代码路径还是不够的

[root@localhost nginx-0.7.16]#make  ; meke install

#cd   /usr/local/nginx/conf/nginx.conf

#vi  nginx.conf

user  www www;                       //设置用户和组

worker_processes  4;             //生成进程数,等于CPU总核数两倍
 
error_log  /data1/logs/nginx_error.log crit;      //错误日志路径,错误日志可选项为:【debug  info  notice  warn  error   crit】
 
pid        /usr/local/nginx/logs/nginx.pid;              //PID路径
worker_rlimit_nofile 51200;                                 //指定文件描述符数量
 
events {
    use epoll;               //使用网络I/O模型
    worker_connections  51200;            //允许连接数,文件描述符
}
 
 
http
 {
    include       mime.types;           //文件类型
    default_type  application/octet-stream;         //默认文件类型
    charset  UTF-8                       //语言类型
    server_names_hash_bucket_size 128;               //根据CPU的cache来设定
    client_header_buffer_size 4;          //记录缓存4k
    large_client_header_buffers 4 8k;      //如果4k不够,用8k
 
    sendfile        on;         //指定nginx是否调用sendfile函数(zero copy方式)来输出文件,普通应用必须设为on,对于普通文件用on。如果进行下载I/O负载应用,设置为off,以平衡磁盘磁盘和网络I/O处理速度。
    #tcp_nopush     on;      //允许或禁止使用socket的TCP_NOPUSH(on freebsd或TCP_COR(on  linux),此选择仅仅在使用sendfile时候可用,
 
    keepalive_timeout  65;            //长连接超时时间
    tcp_nodelay on;
    fastcgi_connect_timeout 300;
    fastcgi_send_timeout 300;
    fastcgi_read_timeout 300;
    fastcgi_buffer_size 64k;
    fastcgi_buffers 4 64k;
    fastcgi_busy_buffers_size 128k;
    fastcgi_temp_file_write_size 128k;
 
   #开启gzip压缩,用于支持在线实时压缩输出数据流
    gzip on;                          //off关闭或者on开启gzip功能
    gzip_min_length 1k;  //设置允许压缩最小字节数,0表示多大都压,最好设置大于1k,小于1k越压越大
    gzip_buffers 4 16k;        //系统获取几个单位的缓存,用于存储gzip压缩结果数据流。4 4k 代表以4k为单位,按照原始数据大小以4k为单位的4倍申请内存。 4 8k 代表以8k为单位,按照原始数据大小以8k为单位的4倍申请内存,如果没有设置,默认值是申请跟原始数据相同大小的内存空间去存储gzip压缩结果。
    gzip_http_version 1.1;    //判断http协议版本,是否支持压缩,否则用户看到乱码。默认即可,大部分都得支持
    gzip_comp_level 2;     //gzip压缩比,1 压缩比最小处理速度最快,9 压缩比最大但处理最慢
    gzip_types text/plain application/x-javascript text/css application/xml;     //默认nginx是开启gzip压缩,但是只针对html文件押送  gzip_types       text/plain application/x-javascript text/css text/html application/xml text/javascript;  在nginx的gzip的gzip_types加上
    gzip_vary on;   //和http头有关系,加个vary头,给代理服务器用的,有的浏览器支持压缩,有的不支持,所以避免浪费不支持的也压缩,所以根据客户端的HTTP头来判断,是否需要压缩。
 
    client_max_body_size 50m;             //允许客户端请求的最大单个文件字节数
    client_body_buffer_size 128k;        //缓冲区代理用户端请求的最大字节数,可以理解先保存到本地在穿给用户
    proxy_connect_timeout 600;        //和后端服务器连接的超时时间,发起握手等候相应超时时间
    proxy_read_timeout 600;         //连接成功后,等待后端服务器相应时间,已经进入后端的排队之中等候处理
    proxy_send_timeout 600;        //后端服务器数据回传时间,在规定时间内服务器必须传完所有数据
    proxy_buffer_size 16k;        //只保存用户头信息一共nginx进行规则处理,用于缓存代理请求
    proxy_buffers    4 32k;     //告诉nginx保存单个用的几个Buffer最大用多大空间
    proxy_busy_buffers_size 64k;   //如果系统很忙可以申请更大的proxy_buffers,官方推荐 *2
    proxy_temp_file_write_size 64k;    //proxy缓存临时文件大小
 
    upstream http_server_pool {
        server 192.168.1.2:8080 weight=4 max_fails=2 fail_timeout=30s;
        server 192.168.1.3:8080 weight=2 max_fails=2 fail_timeout=30s;
     }          //设置地址池,后端2台服务器
 
    server          //第一个虚拟主机,反向代理http_server_pool这组服务器
      {
        listen       80;                                        //监听端口
        server_name  www.xiao.com;           //主机名称
 
        location /
        {
                proxy_next_upstream error timeout invalid_header http_500 http_503 http_404; //http://www.2tutu.com/post/2008/631.html         //后端服务器返回500 503 404错误,自动请求转发到upstream池中另一台服务器
                proxy_pass http://http_server_pool;
                proxy_set_header Host www.xiao.com;
                proxy_set_header X-Forwarded-For  $remote_addr;
        }
        access_log  logs/www.xiao.com.access.log  combined;
       }
       }
proxy_set_header Host www.xiao.com
proxy_set_header  Host  $host 首先说明 proxy_set_header 指令在向反向代理的后端Web服务器发起请求时添加指定的 Header头信息,后端web服务器有多个基于域名的虚拟主机时,通过头信息Host,用于指定请求的域名,这样后端web才能识别反向代理请求哪个虚拟主机处理。
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for :联系下面PS中所写,在后端web中就算加上$http_x_Forwarded_for这条,也得不到用户的IP,所以在nginx反向代理添加Header头信息 X-Forwarded-For在配合后端服务器日志文件的$http_x_Forwarded_for这条就可以获得用户的IP地址了。

 PS:假设Nginx作为Web服务器,nginx或Squid作为反向代理后,就不能获取客户端的真实IP地址了,由于在客户端和Web增加了中间层,web没有真实的IP,通过$remote_addr变量拿到是反向代理的IP,Web代理可以增加$http_x_Forwarded_for信息,用于记录客户端IP和原来客户请求的服务器地址,在日志格式中加上即可。

  log_format  main   '$http_x_Forwarded_for '
                       '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
    access_log  /tmp/Nginx.access.log  main;                                 //在后端Web里面加上这样就可以了

upstream : nginx支持4种算法,下面一一介绍

1、 轮询

每个请求按时间顺序分配到不同的后端服务器了,后端服务器down掉,自动切除。

2、weight

设定服务器权值: weight=2

                                  weight=4          服务器性能不均时候使用

3、 ip_hash

每个请求按访问ip的hash结果分配,每个访客有固定的后端服务器,可以解决session问题

4、 fair(第三方)

按后端服务器的响应时间来分配,响应时间短的优先分配

5、url_hash (第三方)

按访问的url的hash结果分配,使每个url定向到同一个后端服务器,后端为缓存服务器比较有效。

以往的架构lvs或者dns轮询,这样虽然squid里面的均衡的,但是忽略了一点就是数据量,虽然每台squid是均匀但是都是满载的,重复的请求,会占用很多空间,在前面换上nginx在配上 url_hash,根据url分流后,每一个url会只存在一个squid上,每台squid数据完全不同。http://edu.codepub.com/2010/0202/20282.php

upstream http_server {             //定义负载均衡设备的Ip及设备状态
  ip_hash;
   server 127.0.0.1:9090 down;
   server 127.0.0.1:8080 weight=2;
   server 127.0.0.1:6060;
   server 127.0.0.1:7070 backup;
  }

down : 当前的IP server暂时不参与负载,不进行反向代理

weight: 默认为1,weight越大,负载的权重越大

max_fails: 允许请求失败的次数默认为1,当超过最大次数时,返回proxy_next_upstream模块定义的错误。

fail_timeout : max_fails次失败后,暂停的时间

backup:  其它所有非backup机器down或者忙时候,请求backup机器,这台机器压力最轻

PS: nginx支持同时设置多组负载均衡,给不同的server使用

location:设置对URL进行匹配,比如 location  /  ,  location  /data 这两个设置优先级,/ 下也可以,但是不如 /data下搜索更快,定位更准。