欢迎访问开单素材|精选

京东vs阿里,如何打造支撑万亿电商交易的K8s集群?

时间:2021-01-15    阅读:16644 次      手机扫码打开

01

为什么大厂都在用K8s?


2016年底,京东业务开始从OpenStack切换到Kubernetes,第一阶段迁移20%的业务到kubernetes,集群规模是500+物理节点,2w+Pod容器。

阿里巴巴这边也管理几十个K8S集群,其中最大的集群约 1 万个节点,每个集群会运行几十万个应用,api的QPS达到1000万+。

这得益于K8s拥有强大的生态体系

NO.1

功能齐全的UI界面


NO.2

全方位的立体监控系统


NO.3

功能完备的日志收集平台


02

京东:全球最大K8s集群


CNCF基金会官方确认,京东目前运营着全球最大规模的Kubernetes集群,是目前全球容器化最彻底的互联网企业之一。



为了应对618的订单洪峰,京容器东云平台带宽扩容数百G,抵挡了数十次攻击,实现了100%的订单都在云上完成。


(京东K8s集群架构图参考)


京东运行的Docker实例突破了上百万个,而这些Docker都是通过k8s来维护管理。


03

阿里巴巴:万级规模K8s集群


支撑阿里巴巴核心电商业务的集群有十几个,最大的K8s集群有几万的节点。


(阿里巴巴K8s集群架构图参考)


阿里巴巴通过一系列的增强与优化,成功将Kubernetes应用到生产环境并达到了单集群10000 节点的超大规模,具体包括:


1

通过将索引和数据分离、数据shard等方式提高etcd存储容量,并最终通过改进etcd底层bboltdb存储引擎的块分配算法,大幅提高了etcd在存储大数据量场景下的性能,通过单 etcd集群支持大规模Kubernetes集群,大幅简化整个系统架构复杂性

通过落地Kubernetes轻量级心跳、改进HA集群下多个API Server节点的负载均衡、ListWatch机制中增加 bookmark、通过索引与Cache的方式改进了 Kubernetes大规模集群中最头疼的List性能瓶颈,使得稳定的运行万节点集群成为可能

2

3

通过热备的方式大幅缩短controller/scheduler在主备切换时的服务中断时间,提高整个集群的可用性


作者:平台,鼠标移到这里,一键关注(个人微信或者微信公众号二维码)。
猜你喜欢精选素材
如果您有更多好的建议,请与我们联系: E-mail:317581450@qq.com
在线分享 返回顶部
分享按钮
在线分享 返回顶部