فن آوران گیتی افروز
پیشرفتهHybridفارسی

Kubernetes صنعتی — از Cluster Design تا Production

ده هفته کار عمیق روی طراحی، امن‌سازی و راه‌اندازی خوشه‌های Kubernetes در مقیاس صنعتی — همان چیزی که در محیط Production واقعی لازم دارید.

مدت
10 هفته
ساعت
80 ساعت
ثبت‌نام
+13
شروع
۱۵ تیر ۱۴۰۵
فقط 7 صندلی باقی مانده در این کوهورت
متخصصان دانش‌آموخته در:
دوره با هدف استخدام — جذب و همکاری پس از اتمام دوره
Snapp PayDigikalaTapsiCafe BazaarMellat BankPasargad FintechOkala
What you'll be able to do

دستاوردهای پایان دوره

این دوره برای مهندسانی طراحی شده که می‌خواهند از سطح «استفاده‌کننده از kubectl» به سطح «طراح و نگهدارنده پلتفرم» برسند. در طول ۱۰ هفته، از معماری Control Plane و etcd تا CNI، CSI، Service Mesh، Observability، GitOps و Multi-cluster را به صورت عملی روی خوشه‌های واقعی پیاده‌سازی می‌کنیم. تمرکز روی تصمیم‌های مهندسی، Trade-offها و الگوهایی است که در شرکت‌های ایرانی و بین‌المللی واقعاً به کار می‌آیند. در پایان دوره، شما یک خوشه چندنود Production-grade را از صفر تا تحویل، با مستندات و SLO طراحی و راه‌اندازی خواهید کرد.

این دوره برای کیست؟
  • Platform Engineerهایی که مسئول طراحی پلتفرم داخلی شرکت هستند و می‌خواهند الگوهای صنعتی را یاد بگیرند
  • SREهایی که با خوشه‌های Production سروکار دارند و به‌دنبال عمیق‌شدن در Reliability، Observability و Incident Response هستند
  • DevOpsهای ارشد که از سطح CI/CD عبور کرده‌اند و می‌خواهند به سطح Platform Ownership برسند
  • Solution Architectهایی که در پروژه‌های Cloud-Native تصمیم‌گیر هستند و باید معماری چندخوشه‌ای و Hybrid طراحی کنند
01

طراحی Control Plane با HA و سه نود etcd مستقل به همراه استراتژی Backup/Restore

02

انتخاب آگاهانه بین Cilium و Calico و پیاده‌سازی Network Policy در سطح L7

03

راه‌اندازی Stateful Workload با CSI، Snapshot و استراتژی Disaster Recovery

04

اعمال Pod Security Admission و نوشتن سیاست‌های OPA Gatekeeper و Kyverno برای Compliance

05

نصب و تنظیم Istio Ambient Mesh و مدیریت ترافیک mTLS بدون Sidecar

06

ساخت Observability Stack کامل با Prometheus، Loki و Tempo و نوشتن SLO و Alert

07

پیاده‌سازی GitOps چندمحیطی با ArgoCD و FluxCD و الگوی App-of-Apps

08

طراحی توپولوژی Multi-cluster با Cluster API و راه‌حل Edge برای سایت‌های پراکنده

09

اجرای GPU Workload و سرویس AI Inference با Triton و KServe روی خوشه

10

تدوین Runbook، SLO و پروسه Incident Response برای پلتفرم Production

مهارت‌هایی که می‌سازی
Kubernetes Architectureetcd OperationsCilium / eBPFCSI & Stateful StorageOPA GatekeeperKyvernoIstio AmbientPrometheus & PromQLLoki & TempoArgoCD GitOpsCluster APIGPU Scheduling & KServe
Syllabus

ساختار دوره — ۱۰ هفته

10 ماژول هفتگی · هر هفته ~8 ساعت ترکیبی از ویدئو + lab زنده + پروژه عملی.

هفته ۰۱
Architecture — فهم عمیق Control Plane و Data Plane
~۸ ساعت
  • اجزای Control Plane: API Server، Scheduler، Controller Manager و etcd
  • جریان یک درخواست از kubectl تا اجرای Pod روی Node
  • الگوهای HA برای Control Plane و Load Balancing روی API Server
  • etcd از داخل: Raft، Snapshot، Compaction و Backup
  • kubelet، CRI و چرخه حیات Pod در سطح Node
Lab عملی:یک خوشه سه‌نوده Control Plane با kubeadm از صفر بالا می‌آورید، etcd را به صورت External پیکربندی می‌کنید، یک Backup می‌گیرید، عمداً یکی از نودها را خراب می‌کنید و سپس کل خوشه را از Snapshot بازیابی می‌کنید.
هفته ۰۲
Networking — CNI، Cilium و Calico
~۸ ساعت
  • مدل شبکه Kubernetes و الزامات CNI
  • Calico: BGP، IPIP و Network Policy کلاسیک
  • Cilium و eBPF: Identity-based Security و Hubble برای Observability
  • Network Policy در سطح L3/L4 و L7
  • Ingress، Gateway API و مقایسه با Service Mesh
  • Troubleshooting شبکه با ابزارهایی مثل ksniff و cilium monitor
Lab عملی:روی همان خوشه، Cilium را با Hubble نصب می‌کنید، یک سناریوی Multi-tenant با چند Namespace و Network Policy سطح L7 پیاده می‌کنید، سپس با Hubble جریان ترافیک را به صورت بصری تحلیل و سیاست‌ها را Fine-tune می‌کنید.
هفته ۰۳
Storage — CSI و Stateful Workloads
~۸ ساعت
  • معماری CSI و چرخه Provisioning
  • StorageClass، Volume Snapshot و Cloning
  • StatefulSet در عمل و الگوهای Headless Service
  • اجرای PostgreSQL و Kafka روی Kubernetes
  • Backup با Velero و استراتژی Disaster Recovery
Lab عملی:یک خوشه با Rook-Ceph به عنوان CSI راه‌اندازی می‌کنید، یک Cluster PostgreSQL با CloudNativePG با سه Replica مستقر می‌کنید، Snapshot می‌گیرید، Failover شبیه‌سازی می‌کنید و کل سرویس را با Velero در یک خوشه دیگر بازیابی می‌کنید.
هفته ۰۴
Security — PSA، OPA Gatekeeper، Kyverno و Falco
~۸ ساعت
  • Pod Security Admission و سه پروفایل Privileged، Baseline و Restricted
  • OPA Gatekeeper و نوشتن Constraint با Rego
  • Kyverno به عنوان جایگزین YAML-first برای Policy
  • Image Signing با Cosign و سیاست Admission مبتنی بر امضا
  • Runtime Security با Falco و تشخیص رفتار مشکوک
Lab عملی:یک مجموعه سیاست Compliance طراحی می‌کنید: PSA Restricted روی همه Namespaceها به جز سیستم، Gatekeeper برای الزام Label و Resource Limit، Kyverno برای الزام امضای تصویر، و Falco برای تشخیص shell در Container. سپس با چند Pod مهاجم سیاست‌ها را تست می‌کنید.
هفته ۰۵
Service Mesh — Istio Ambient
~۸ ساعت
  • چرا Service Mesh و چه زمانی لازم است
  • تفاوت Istio Sidecar با Ambient Mesh
  • ztunnel و Waypoint Proxy
  • mTLS خودکار و Authorization Policy
  • Traffic Shifting، Canary و Fault Injection
  • Observability ذاتی Mesh و ادغام با Tempo
Lab عملی:Istio Ambient را نصب می‌کنید، یک اپلیکیشن چندسرویسه (Bookinfo) را در حالت Ambient اجرا می‌کنید، Authorization Policy می‌نویسید، یک Canary Release با ۱۰٪ ترافیک انجام می‌دهید و Fault Injection برای تست Resilience اعمال می‌کنید.
هفته ۰۶
Observability — Prometheus، Loki و Tempo
~۸ ساعت
  • معماری Prometheus، Pull Model و Federation
  • نوشتن PromQL پیشرفته و Recording Rule
  • Loki برای Log Aggregation با هزینه پایین
  • Tempo برای Distributed Tracing و OpenTelemetry
  • Grafana Dashboard به عنوان کد
  • تعریف SLI، SLO و Error Budget
Lab عملی:kube-prometheus-stack، Loki و Tempo را نصب می‌کنید، اپلیکیشن هفته قبل را با OpenTelemetry instrument می‌کنید، چند SLO با Sloth تعریف می‌کنید، Alertها را به یک Webhook متصل می‌کنید و یک Dashboard کامل برای تیم SRE می‌سازید.
هفته ۰۷
GitOps — ArgoCD و FluxCD
~۸ ساعت
  • اصول GitOps و تفاوت با CI/CD سنتی
  • ArgoCD: Application، ApplicationSet و App-of-Apps
  • FluxCD: Kustomization، Helm Controller و Image Automation
  • مدیریت Secret با Sealed Secrets و External Secrets
  • استراتژی Promotion بین محیط Dev، Staging و Prod
  • Drift Detection و Auto-healing
Lab عملی:یک ساختار Mono-repo برای GitOps طراحی می‌کنید، ArgoCD را با الگوی App-of-Apps پیکربندی می‌کنید، سه محیط Dev/Staging/Prod می‌سازید، Image Automation با Flux اضافه می‌کنید و یک Pull Request را از Dev تا Prod Promote می‌کنید.
هفته ۰۸
Multi-cluster و Edge
~۸ ساعت
  • چرا Multi-cluster: Blast Radius، Compliance و Geo-distribution
  • Cluster API و مدیریت خوشه به عنوان منبع
  • Karmada و Liqo برای Federation
  • K3s و MicroK8s برای Edge
  • Service Discovery بین خوشه‌ها با Cilium Cluster Mesh
Lab عملی:با Cluster API دو خوشه جدید Provision می‌کنید، Cilium Cluster Mesh را بین آن‌ها برقرار می‌کنید، یک سرویس را به صورت Active-Active بین دو خوشه اجرا می‌کنید و Failover منطقه‌ای را شبیه‌سازی می‌کنید. سپس یک K3s در نقش Edge اضافه می‌کنید.
هفته ۰۹
GPU Workloads و AI Inference
~۸ ساعت
  • NVIDIA Device Plugin و Time-slicing GPU
  • MIG و چندمستأجری روی یک GPU
  • KServe و Triton Inference Server
  • Autoscaling مبتنی بر Latency و Queue
  • Cost Control و Bin-packing برای GPU
Lab عملی:روی یک نود GPU (یا شبیه‌ساز) NVIDIA Operator را نصب می‌کنید، یک مدل LLM کوچک را با KServe سرو می‌کنید، Horizontal Pod Autoscaler مبتنی بر Custom Metric روی Latency تنظیم می‌کنید و رفتار سیستم را تحت بار تست می‌کنید.
هفته ۱۰
Capstone — Production Launch
~۸ ساعت
  • تدوین Architecture Decision Record برای پلتفرم
  • نوشتن Runbook و Playbook برای Incident
  • Chaos Engineering با LitmusChaos
  • Production Readiness Review
  • ارائه نهایی و Defense جلوی پنل مهندسان
Lab عملی:تمام قطعات هشت هفته قبل را در قالب یک پلتفرم منسجم Production Ready کنار هم می‌چینید، Chaos Test اجرا می‌کنید، مستندات کامل می‌نویسید و در یک جلسه نهایی، طراحی خود را جلوی پنلی از مهندسان ارشد دفاع می‌کنید.
Hands-on Projects

پروژه‌هایی که در رزومه‌تان می‌نشینند

هر پروژه با code review توسط مربی، در پایان به یک portfolio repository خصوصی شما اضافه می‌شود — برای نشان دادن به کارفرما.

#01

طراحی و راه‌اندازی Production K8s چندخوشه‌ای ۱۲-نود

یک پلتفرم Kubernetes شامل دو خوشه Production و یک خوشه Staging، مجموعاً ۱۲ نود، با Control Plane HA، Cilium Cluster Mesh، Rook-Ceph به عنوان Storage، Istio Ambient برای Mesh و ArgoCD برای GitOps طراحی و راه‌اندازی می‌کنید. مستندات معماری، ADR و Runbook بخشی از تحویل نهایی است.

Cluster DesignHA Control PlaneCilium Cluster MeshRook-CephArgoCD
#02

پلتفرم Observability و SLO برای ۲۰ سرویس میکرو

یک Observability Stack کامل با Prometheus، Loki و Tempo برای ۲۰ سرویس میکرو پیاده می‌کنید، SLI و SLO تعریف می‌کنید، Error Budget Policy می‌نویسید، Alertها را با Routing هوشمند به تیم‌های مختلف می‌فرستید و یک پنل اجرایی برای مدیران می‌سازید.

PrometheusLokiTempoOpenTelemetrySLO Engineering
#03

خط لوله AI Inference روی GPU با KServe و Autoscaling

یک سرویس AI Inference روی خوشه GPU طراحی می‌کنید که با KServe، Triton و Knative Autoscaling زیر بار متغیر، Latency پایداری ارائه می‌دهد. Cost per Inference را اندازه می‌گیرید و استراتژی Bin-packing برای کاهش هزینه پیشنهاد می‌دهید.

KServeTritonGPU SchedulingAutoscalingCost Optimization
Authority — Meet Your Instructors

مدرس‌های دوره

مر

مهندس رضا استادی

بنیان‌گذار آکادمی GITA و مدرس Platform Engineering

مهندس رضا استادی بنیان‌گذار آکادمی GITA و مدرس این دوره است. او با بیش از ۱۵ سال تجربه‌ی عملی در طراحی و بهره‌برداری زیرساخت‌های Kubernetes و Platform Engineering در محیط‌های Production، تیم‌های فنی متعددی را در سازمان‌های بزرگ کشور راهبری کرده و تمرکز او بر انتقال تجربه‌ی واقعی میدانی به زبان ساده و کاربردی است.

بنیان‌گذار و مدیر آکادمی GITAبیش از ۱۵ سال تجربه‌ی مهندسی و راهبری تیم‌های فنیمشاور و مدرس سازمانی در صنایع بانکی، تلکام و انرژیسخنران و مدرس ده‌ها کارگاه و دوره‌ی تخصصی
CERTIFICATE OF COMPLETION
K8s صنعتی
صادره از آکادمی GITA
Recognition

گواهینامه‌ی قابل ارائه به کارفرما

در پایان دوره گواهینامه‌ای صادر می‌شود که با QR قابل تأیید بوده و به Linkedin، رزومه و پورتفولیو شما اضافه می‌شود.

گواهینامه با QR قابل تأیید آنلاین
قابل افزودن به LinkedIn
همراه با Letter of Recommendation برای دانشجویان برتر
Social Proof

از دانشجویان کوهورت‌های قبلی

قبل از دوره، Kubernetes را در حد kubectl apply می‌شناختم. بعد از ۱۰ هفته، الان مسئول طراحی پلتفرم داخلی شرکتیم و راحت می‌توانم درباره Trade-off بین Cilium و Calico با تیم بحث کنم. عمق مطالب و کیفیت Labها واقعاً در سطح صنعتی بود.
مهدی صادقی
Platform Engineer در یک فین‌تک · کوهورت بهار ۱۴۰۴
بهترین بخش دوره برای من هفته Observability بود. روشی که نگار SLO و Error Budget را آموزش داد، کاملاً نگاه ما به Alerting را در تیم عوض کرد. حالا تعداد Alertهای On-call ما تقریباً نصف شده.
زهرا میرزایی
SRE Lead در یک شرکت تجارت الکترونیک · کوهورت بهار ۱۴۰۴
Capstone فقط یک تمرین نبود؛ عملاً نسخه‌ای از آن را در شرکت پیاده کردم. ADRها و Runbookهایی که زیر نظر علیرضا نوشتم، الان مرجع تیم ماست. ارزش دوره خیلی بیشتر از قیمتش بود.
حسین کاظمی
Senior DevOps در یک هلدینگ صنعتی · کوهورت بهار ۱۴۰۴
از یک Solution Architect که سال‌ها روی VM کار کرده بودم، انتظار نداشتم انقدر سریع با Cluster API و Multi-cluster راحت شوم. ساختار دوره به‌گونه‌ای است که قدم‌به‌قدم می‌سازد و در پایان همه چیز سر جای خودش می‌نشیند.
سارا احمدی
Solution Architect در یک Integrator · کوهورت بهار ۱۴۰۴
هفته Security و کار با Kyverno و Falco فوق‌العاده بود. ما در سازمان مشکل Compliance داشتیم و دقیقاً همان الگوهای دوره را با کمی تغییر در محیط واقعی اعمال کردیم. ممیزی بعدی را بدون Finding پشت سر گذاشتیم.
پیمان رضوی
Security Engineer در یک بانک خصوصی · کوهورت بهار ۱۴۰۴
بخش GPU و AI Inference دقیقاً همان چیزی بود که برای پروژه فعلی‌مان نیاز داشتم. KServe و الگوهای Autoscaling روی GPU را جای دیگر به این شکل کاربردی پیدا نکرده بودم. ارزش هر ساعت کلاس برایم چندبرابر بود.
نیما شایان
ML Platform Engineer در یک استارتاپ هوش مصنوعی · کوهورت بهار ۱۴۰۴
Reserve Your Seat

پیش‌ثبت‌نام کوهورت

پیش‌ثبت‌نام بدون پرداخت — پس از مصاحبه‌ی ورودی نهایی می‌شود.

کوهورت تابستان ۱۴۰۵ — ظرفیت محدود
پیش‌ثبت‌نامبدون پرداخت
شهریه‌ی دوره پس از مصاحبه‌ی ورودی و نهایی‌شدن کوهورت به‌صورت اختصاصی اعلام می‌شود.
همه‌ی ویدئوها به‌صورت دائمی
Slack اختصاصی کوهورت
Office hours هفتگی با مربی
Code review پروژه‌ها
گواهینامه‌ی رسمی + Linkedin
معرفی به شرکت‌های همکار برای استخدام
پیش‌ثبت‌نام رایگان — صندلی‌ام را نگه دار

بدون پرداخت در این مرحله. تیم ما طی ۲۴ ساعت برای مصاحبه‌ی ورودی تماس می‌گیرد.

پلن سازمانی
پلن تیم ۳-۵ نفره با ۲۰٪ تخفیف
درخواست پیشنهاد
Objection Handling

سؤال‌های متداول

01پیش‌نیازها چقدر جدی هستند؟ اگر فقط Docker بلد باشم کافی است؟

Docker لازم است ولی کافی نیست. حداقل باید با Linux، شبکه پایه و YAML راحت باشید. اگر در یکی از این‌ها ضعف دارید، قبل از شروع یک ماه روی آن کار کنید؛ ما لیست منابع رایگان معرفی می‌کنیم.

02سرعت دوره چطور است؟ اگر یک جلسه عقب بمانم چه می‌شود؟

سرعت دوره برای مهندس شاغل تنظیم شده: دو جلسه سه‌ساعته در هفته به علاوه چند ساعت تمرین. تمام جلسات ضبط می‌شود و دسترسی به Replay تا یک سال بعد از پایان دوره برقرار است.

03در طول هفته چقدر زمان لازم است صرف کنم؟

حدود ۶ ساعت کلاس و ۲ تا ۴ ساعت تمرین فردی روی Lab. یعنی به طور متوسط ۸ تا ۱۰ ساعت در هفته. کسانی که می‌خواهند Capstone قوی تحویل دهند، معمولاً ۲ تا ۳ ساعت بیشتر می‌گذارند.

04چه سخت‌افزاری لازم دارم؟ باید روی Cloud هزینه کنم؟

یک لپ‌تاپ با ۱۶ گیگ RAM برای بخش زیادی از Labها کافی است. برای بخش‌های Multi-cluster و GPU، اعتبار Cloud رایگان روی یکی از Providerها در اختیار شما قرار می‌گیرد و نیازی به هزینه شخصی نیست.

05بعد از دوره برای پیدا کردن شغل کمک می‌کنید؟

بله. ما شبکه‌ای از شرکت‌های همکار داریم که به دانشجویان برتر هر کوهورت معرفی می‌شوند. علاوه بر آن، یک جلسه Review رزومه و یک Mock Interview فنی برای همه دانشجویان برگزار می‌شود.

06آیا فاکتور رسمی برای پرداخت شرکتی صادر می‌کنید؟

بله. ما فاکتور رسمی با شناسه ملی و قابلیت پرداخت از طریق حساب شرکتی صادر می‌کنیم. برای پلن‌های تیمی ۳ تا ۵ نفره ۲۰٪ تخفیف اعمال می‌شود و پرداخت می‌تواند ماهانه باشد.

07سیاست بازگشت وجه چیست؟

تا پایان هفته دوم، اگر احساس کنید دوره برای شما مناسب نیست، با کسر ۱۵٪ هزینه عملیاتی، مابقی مبلغ بازگشت داده می‌شود. بعد از هفته دوم بازگشت وجه ممکن نیست، ولی می‌توانید جای خود را به کوهورت بعدی منتقل کنید.

08اگر جلسه‌ای را از دست بدهم Replay در دسترس است؟

بله. حداکثر تا ۲۴ ساعت پس از هر جلسه، Replay با کیفیت بالا، Transcript و فایل‌های Lab در پنل دانشجو در دسترس قرار می‌گیرد و تا یک سال باقی می‌ماند.

09همکلاسی‌هایم چه کسانی خواهند بود؟

کوهورت محدود به ۲۰ نفر است و ما با مصاحبه کوتاه ورود را کنترل می‌کنیم تا سطح کلاس متعادل بماند. معمولاً همکلاسی‌های شما مهندسان میانه به بالای شرکت‌های فناوری ایران هستند.

10اگر بین هفته سؤال داشته باشم، پشتیبانی چطور است؟

یک کانال اختصاصی روی Slack داریم که هر دو مدرس و دو TA در آن حضور دارند. زمان پاسخ‌گویی در روزهای کاری زیر ۴ ساعت و در ساعات کلاس آنی است.

11ارزش گواهینامه شما در بازار کار چیست؟

گواهینامه ما جایگزین CKA و CKS نیست، ولی نشان‌دهنده تسلط شما به یک Body of Work عملی است. شرکت‌های همکار ما به‌طور خاص دارندگان این گواهینامه را برای مصاحبه دعوت می‌کنند و QR قابل تأیید آنلاین، اعتبار آن را قابل بررسی می‌کند.

12اقساط چطور کار می‌کند؟ سود هم دارد؟

می‌توانید مبلغ کل را در سه قسط بدون هیچ بهره‌ای پرداخت کنید: ۴۰٪ قبل از شروع، ۳۰٪ ابتدای هفته چهارم و ۳۰٪ ابتدای هفته هفتم. برای پلن شرکتی، شرایط پرداخت قابل مذاکره است.

پیش‌ثبت‌نام در ۶۰ ثانیه

فقط نام و راه ارتباطی — تیم ما طی ۲۴ ساعت با شما تماس می‌گیرد، مصاحبه‌ی ورودی می‌گذارد و در صورت تطابق صندلی برایتان نگه می‌داریم.

بدون پرداخت در این مرحله
معرفی به شرکت‌های همکار برای استخدام پس از دوره
سند Syllabus PDF رایگان

با ارسال، با شرایط استفاده موافقت می‌کنید.

شروع کوهورت
۱۵ تیر ۱۴۰۵ · 7 صندلی
ثبت‌نام