Operator 多可用区选主优化与 Lease 版本分析

什么是 Lease? Lease 对象的核心作用是表示某个实体(通常是一个 Pod 或进程)对某项资源或角色的“持有权”,并且这种持有权是有时间限制的。通过定期续约(renew),持有者可以保持其控制权。如果持有者未能续约,租约到期后,其他实体可以接管。 常见的应用场景包括: 领导选举:在分布式系统中,确保只有一个实例(Leader)执行特定任务,其他实例作为 Follower。 资源协调:跟踪和管理资源的临时所有权。 心跳机制:通过续约时间(RenewTime)检测持有者是否仍然活跃。 Kubernetes 内部的一些组件(如 kube-controller-manager 和 kube-scheduler)就使用 Lease 来实现高可用性和领导选举。 Lease 的工作原理 创建租约: 一个进程(如你的代码)创建一个 Lease 对象,并声明自己为持有者(HolderIdentity)。 续约: 持有者需要定期更新 RenewTime,证明自己仍然活跃。通常通过客户端(如 kubectl 或 Go 客户端)调用 Kubernetes API 来更新。 失效与接管: 如果持有者未能及时续约(例如进程崩溃),其他进程可以通过检查 RenewTime 和 LeaseDurationSeconds 判断租约是否过期,并尝试接管。 领导选举: 多个实例竞争同一 Lease 对象时,只有成功创建或更新它的实例成为 Leader。 示例场景 假设你用这个 Lease 来实现领导选举: 你有一个分布式应用,有 3 个 Pod:pod-1、pod-2、pod-3。 它们都尝试创建或更新同一个 Lease 对象(例如 my-leader-lease)。 pod-1 成功创建,设置 HolderIdentity: “pod-1”,成为 Leader。 pod-1 每 10 秒更新 RenewTime,保持领导地位。 如果 pod-1 崩溃,RenewTime 未更新,pod-2 检测到租约过期,接管并更新 HolderIdentity: “pod-2”。 现有逻辑 // Copyright 2018 The Operator-SDK Authors // // Licensed under the Apache License, Version 2.0 (the "License"); // you may not use this file except in compliance with the License. // You may obtain a copy of the License at // // http://www.apache.org/licenses/LICENSE-2.0 // // Unless required by applicable law or agreed to in writing, software // distributed under the License is distributed on an "AS IS" BASIS, // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. // See the License for the specific language governing permissions and // limitations under the License. package main import ( "context" "time" "github.com/operator-framework/operator-sdk/pkg/k8sutil" // Operator-SDK 提供的...

创建: 2025-03-19 | 字数: 6652字 | 时长: 14分钟

Kuboard-spray 图形化安装高可用的 Kubernetes

不管你有没有听说过Kuboard,它都是一个非常有名的K8s管理工具,官方描述的是Kuboard - Kubernetes 多集群管理界面,我这次想介绍的是Kuboard-spray ...

创建: 2023-07-07 | 字数: 770字 | 时长: 2分钟

K8s 中 Pod 的调试技巧

今天在逛大佬的博客时又学到好东西了,特此记录一下,关于K8s中Pod调试的奇技淫巧,虽然不一定能用到,但是值得记录 ...

创建: 2023-06-13 | 字数: 628字 | 时长: 2分钟

Kubernetes 和 Flask 的组合

众所周知Minikube有自带的dashboard,输入命令minikuke dashboard打开链接就能看到,某日突发奇想,加入公司内部需要一个自定义的kubernetes监控平台,以满足一些自定义的需求呢?比如,我想看到最近新建的100个pod,或者我想看最近的k8s集群的events,使用flask来开发一个平台满足自定义,是一个不错的选择。 ...

创建: 2023-05-14 | 字数: 589字 | 时长: 2分钟

Grafana 和两辆边车 - sidecar

在Kubernetes中,Sidecar是一种部署模式,它可以在同一个Pod中运行多个容器,其中一个是主容器,其他的容器则是Sidecar容器,用来提供一些辅助功能。 常见的Sidecar使用场景包括: 日志收集:在一个Pod中运行一个主应用程序和一个日志收集器Sidecar,通过共享Pod内的数据卷,让日志收集器能够收集主应用程序产生的日志信息。 数据同步:在一个Pod中运行一个主应用程序和一个数据同步器Sidecar,数据同步器可以将主应用程序产生的数据同步到其他地方(如外部存储或者其他Pod)。 健康检查:在一个Pod中运行一个主应用程序和一个健康检查Sidecar,通过检查主应用程序的状态,来保证应用程序的可用性和稳定性。 在Kubernetes中,可以通过在同一个Pod中定义多个容器来实现Sidecar的部署模式。每个容器都可以访问Pod的共享网络和存储,从而实现数据的共享和交互。需要注意的是,不同容器之间的生命周期是独立的,它们可以独立启动、停止和重启。 ...

创建: 2023-03-17 | 字数: 1800字 | 时长: 4分钟

K8s 学习笔记_Zero2Hero

转载自黑马程序员的Kubernetes(K8S) 入门进阶实战完整教程的笔记课程链接在哔站,共同学习进步。 ...

创建: 2022-12-25 | 字数: 53231字 | 时长: 107分钟

使用 Log-pilot 收集 k8s 中的容器日志

容器时代越来越多的传统应用将会逐渐容器化,而日志又是应用的一个关键环节,那么在应用容器化过程中,如何方便快捷高效地来自动发现和采集应用的日志,如何与日志存储系统协同来高效存储和搜索应用日志。本文将主要跟大家分享下如何通过Log-Pilot来采集容器的标准输出日志和容器内文件日志。 ...

创建: 2022-12-11 | 字数: 1192字 | 时长: 3分钟