varnish的架构
知道varnish的内部结构有两个重要的原因:
首先,架构主要负责性能,其次,它影响你如何将Varnish集成到你自己的架构中。
主程序块是Manager进程,包含在二进制程序varnishd中。
Manager进程的任务是将任务包括缓存委托给子进程。
Manager进程确保每个任务总是有一个进程。
这样设计的主要驱动因素就是安全性。
可以通过以下方式访问Manager的命令行界面(CLI):
1)varnishadm管理界面部分,
2)Varnish Agent vagent2
3)Varnish管理控制台(VAC)(通过vagent2)
Varnish Agent vagent2是一个varnishd服务的开源HTTP REST接口,它提供远程控制和监视服务。
vagent2提供了一种Web UI ,同时你可以编写自己的UI。
vagent2的一些功能是:VCL上传,下载,保存(存储到磁盘),参数查看,存储(还没有持续),显示/清除应急消息,开始/停止/查看varnishd服务,取缔功能,varnishstat 采用JSON格式。
父进程:manager
Manager 进程由root用户所拥有,其主要功能有:
应用配置更改(从VCL文件和参数)
将任务委托给子进程:Cacher和VCL到C编译器(VCC)
监视varnish
提供一个varnish命令行界面(CLI)
初始化子进程:Cacher
Manager进程每几秒钟检查一次cacher是否仍然存在。
如果Manager在由ping_interval给定的时间间隔内没有得到回复,那么Manager将杀死Cacher并重新启动。
如果Cacher意外退出,也会发生自动重启。
你可以通过使用varnishadm ping来进行手动ping。
子进程的自动重启是Varnish的一种复原属性,这个属性可以确保即使Varnish包含一个可以危害子进程的重要bug,子进程通常也会在几秒钟内重新启动,您可以使用auto_restart参数切换此属性。
注意:
即使您没有察觉到长时间的服务停机时间,您也应该检查varnish的子进程是否正在重新启动。
这一点很重要,因为子进程重启会导致额外的加载时间,因为这段时间中varnishd会不断清空缓存。
自动重启的日志记录在/var/log/syslog,为了验证子进程是否被重启,你也可以用varnishstat中的MAIN.uptime计数器来检查它的生命周期。
子进程:cacher
由于Cacher侦听的是公共IP地址和已知端口,因此它暴露在恶意客户端面前。
因此,出于安全考虑,这个子进程由非特权用户拥有,并且没有与其父进程Manager进行反向通信。
Cacher的主要功能是:
听取客户端的要求
管理工作线程
存储缓存
记录流量
更新统计的计数器
Varnish使用工作区来减少每个线程在需要获取或修改内存时的争用。
有多个工作区,但最重要的是会话工作区,它用于处理会话数据。
如在输入到缓存之前将www.example.com更改为example.com,来减少重复。
请注意,即使你拥有5 MB的会话工作区并使用1000个线程,但实际的内存使用量也不是5 GB,虚拟内存的使用量确实是5GB,但是除非你真的使用内存,这不是问题,您的内存控制器和操作系统将跟踪您实际使用的内容。
为了与系统的其他部分进行通信,子进程使用VSL访问文件系统,这意味着如果一个线程需要记录某些内容,所需要做的就是设定一个锁,然后写内容到到内存区域,最后再解锁。
除此之外,每个工作线程都有一个缓存用于记录日志数据以此来减少锁定争用。
日志文件通常大约80MB,并分成两部分:第一部分是计数器,第二部分是请求数据,要查看实际数据,可以采用工具解析VSL。
由于日志数据并不意味着都是以原始形式写入磁盘的,因此Varnish可以做得非常详细,这样你可以使用其中一种日志解析工具来提取您想要的信息 - 即可以永久存储也可以实时监控Varnish。
如果Cacher出现问题,它会记录一个详细的应急信息到syslog。
当测试时,你可以使用varnishadm debug.panic.worker 命令或使用vanish agent web 页面上的induce panic按钮来减少varnishd服务的应急信息。
VCL编译
打印编译为C语言的VCL代码并退出:
varnishd - C - f < vcl_filename >
用于检查您的VCL代码是否正确编译。
Varnish配置语言VCL配置了Varnish的高速缓存策,然后VCL被VCC进程转换为C,它是由一个普通的C编译器gcc编译,然后链接到正在运行的Varnish实例中。
由于VCL的编译是在子进程之外完成的,所以不会无意中加载格式不正确的VCL,从而影响正在运行的Varnish实例。
因此,运行Varnish时更改配置非常方便,新的VCL的政策会立即生效,但是,所使用的旧配置缓存的对象可能会一直存在,直到它们没有了旧的引用或新的配置对其执行操作为止。
一个已编译的VCL文件将一直存在,直到完全重启Varnish,或直到管理界面发出vcl.discard命令,在使用完编译的VCL文件后你只能删除。
您可以通过读取vcl.list参数来查看VCL引用的数量。
VCL重载
varnishd可以重新加载VCL程序,无需重新启动,只是重新加载VCL编译代码。
service varnish reload
systemctl reload varnish
varnish_reload_vcl
varnishadm vcl.load <compiledVCL> <VCLsourcecode>
varnishadm vcl.list
varnishadm vcl.use
varnish日志
varnish日志中记录有请求,缓存和对varnish共享内存日志(VSL)的响应信息。
内存日志覆盖有两个效果,一方面没有历史数据,但另一方面却有大量的信息以非常快的速度获得。
当然,仍然可以将日志存储在文件中。
varnish会生成大量的数据,因此它不会将日志默认写入磁盘,而只会记录到内存中。
如果需要记录日志到磁盘上,可以通过在/etc/default/varnishlog和/etc/default/varnishncsa中分别设置VARNISHNCSA_ENABLED=1来实现。
日志工具
显示详细日志:
varnishlog
用于访问特定的数据,它提供了特定客户的信息和要求。
varnishncsa
以NCSA通用日志格式显示varnish访问日志。
varnishtest
允许显示测试中的日志记录和计数器。
统计工具:
varnishstat
用于访问全局计数器,不读取varnish日志中的条目。
varnishtop
读取Varnish日志并呈现最常出现的日志条目的不断更新的列表。
varnishhist
读取Varnish日志,并显示一个连续更新的直方图,显示最后N个请求的处理分布情况。
日志布局
varnish日志事务处理如图所示,varnishlog是最常用的工具之一,并采用了按TCP会话,前端或后端工作者分组的事务机制重新排序事务。
varnishlog的各种参数是为帮助你找到你想要的东西。使用varnishlog可以有效地过滤varnish工作中产生的大量日志数据。
事务处理
varnishlog -g <session|request|vxid|raw> -d
Varnish Transaction IDs (VXIDs,varnish 事务id)被应用于大量不同种类的工作项目中。
事务类型:
session:tcp 会话
request:前端或后端工作者处理的事务
varnish默认按照VXID来分组,1是后端请求BeReq,2是客户端请求Request,3是会话Session。
事务组
事务组是分层的
层级和关系
Level 1: Client request (cache miss)
Level 2: Backend request
Level 2: ESI subrequest (cache miss)
Level 3: Backend request
Level 3: Backend request (VCL restart)
Level 3: ESI subrequest (cache miss)
Level 4: Backend request
Level 2: ESI subrequest (cache hit)