كبير مهندسي موثوقية المواقع

Moledao

قابل للتفاوض
عن بعد5-10 سنوات خبرةبكالوريوسدوام كامل
مشاركة

تفاصيل العمل عن بعد

البلد المفتوححول العالم

متطلبات اللغةإنجليزية

وصف الوظيفة

عرض النص الأصلي

الملخص

نحن نبحث عن مهندس SRE أول (تركيز على عمليات المحفظة) لضمان استقرار وتوافر وأداء البنية التحتية الأساسية لأعمالنا على AWS. يتضمن الدور إدارة بيئات الإنتاج العالمية، وبناء أنظمة قابلة للتوسع وعالية التوافر، وتنفيذ منصات الأتمتة والمراقبة، والحفاظ على معايير الأمان والامتثال.


الغرض من الوظيفة

  • المسؤولية عن النشر.
  • ضمان عمل الأنظمة بشكل موثوق وكفء وعلى نطاق واسع.
  • بناء أدوات لتحسين وقت التشغيل والأداء والاستجابة للحوادث.


المسؤوليات

  • ضمان استقرار وتوافر وأداء البنية التحتية العالمية على AWS لعمليات الأعمال الأساسية، مع تحمل مسؤولية اتفاقيات مستوى الخدمة في بيئة الإنتاج.
  • تصميم وتشغيل واستكشاف أخطاء المكونات السحابية الأصلية مثل Kubernetes وEnvoy وService Mesh (Istio/Linkerd) ووحدات تحكم Ingress.
  • تحسين الكفاءة التشغيلية من خلال أدوات الأتمتة والمنصات (البنية التحتية كرمز IaC، CI/CD)، وتحقيق مراقبة النظام والشفاء الذاتي والتعافي السريع من الحوادث.
  • تنفيذ وصيانة ممارسات الأمن التشغيلي، بما في ذلك التحكم في الوصول (AWS IAM/K8s RBAC)، سياسات أمن الشبكات، إدارة الثغرات، والاستجابة للحوادث.
  • بناء وتعزيز نظام عمليات عالمي، يشمل تخطيط السعة والمراقبة والتنبيه (Prometheus/ELK)، خطوط CI/CD (GitLab/Jenkins)، التعافي من الكوارث، والتعافي التلقائي من الأعطال.
  • فهم معمق لهندسة الأعمال والمشاركة في تصميم حلول عالية التوافر والتعافي من الكوارث، مع تحسين مستمر للتكاليف.


المؤهلات

  • خبرة لا تقل عن 5 سنوات في عمليات Linux أو SRE أو DevOps، مع خبرة متخصصة في إدارة أنظمة موزعة كبيرة الحجم.
  • إجادة خدمات AWS الأساسية (EC2، S3، VPC، IAM، ELB، RDS، إلخ) مع خبرة في التصميم المعماري والتشغيل وتحسين التكاليف.
  • معرفة متعمقة بهندسة Kubernetes، بما في ذلك إدارة واستكشاف أخطاء وضبط أداء عناقيد الإنتاج عالية الحجم.
  • الإلمام بـEnvoy وService Mesh (Istio/Linkerd)، أو وحدات تحكم Ingress مثل Nginx/Istio لإدارة حركة المرور على الطبقة السابعة (L7).
  • وعي وممارسات قوية في الأمن التشغيلي، بما في ذلك الثغرات الأمنية الشائعة في أنظمة التشغيل والشبكات والتطبيقات وإجراءات التخفيف منها.
  • إجادة لغة برمجة واحدة على الأقل (Go/Python/Shell) لتنفيذ حلول الأتمتة للتحديات التشغيلية.
  • خبرة قوية في أطر المراقبة (Observability) مثل Prometheus وELK، والقدرة على بناء منصات مراقبة فعالة.
  • خبرة مثبتة في تخطيط السعة واختبار الأداء، مع القدرة على تحديد اختناقات النظام وقياسها والتخطيط بناءً عليها.


المتطلبات المفضلة:

  • خبرة في إدارة فرق SRE أو أدوات أو منصات.
  • الإلمام بأطر المراقبة مثل Prometheus وGrafana وELK.
  • الشهادات المهنية مثل AWS (SAA/SAP) وKubernetes (CKA/CKE/CKS) تعتبر ميزة إضافية.


Preview

Dorothy Mole

HR OfficerMoledao

إجابة اليوم مرة واحدة

نشر بتاريخ 23 December 2025

Moledao

<50 موظف

DAOs

View jobs hiring

الإبلاغ عن هذه الوظيفة

تذكير أمان Bossjob

إذا كانت الوظيفة تتطلب العمل خارج البلاد، يرجى أن تكون متيقظًا وأن تحذر من الاحتيال.

إذا واجهت صاحب عمل قام بالإجراءات التالية أثناء بحثك عن وظيفة، يرجى الإبلاغ عنه فورًا

  • يحجب هويتك،
  • يتطلب منك تقديم ضمان أو يجمع ممتلكات،
  • يجبرك على الاستثمار أو جمع الأموال،
  • يجمع فوائد غير قانونية،
  • أو حالات غير قانونية أخرى.
Tips
×

Some of our features may not work properly on your device.

If you are using a mobile device, please use a desktop browser to access our website.

Or use our app: Download App