المسؤوليات الوظيفية
أولاً: البنية التحتية وصيانة الخوادم (المسؤوليات الرئيسية)
- مسؤول عن تصميم وبناء وتحسين بنية عنقود الخوادم للشركة (OCI / AWS).
- إدارة خوادم Linux وبيئة النظام وصلاحيات المستخدمين ومفاتيح SSH وSFTP وجدار الحماية ومجموعات الأمان.
- مسؤول عن إدارة Nginx وSSL والوكيل العكسي والنطاقات والشهادات، مع الحفاظ على التوفر العالي والأمن.
- صيانة الآلات الافتراضية وتوازن الأحمال (LB) والتخزين الكائني وشبكات VPC/VCN والشبكات الفرعية وسياسات مجموعات الأمان.
- معالجة مشاكل بيئة الإنتاج: احتلال المنافذ، أخطاء الصلاحيات، فشل بدء الخدمات، امتلاء القرص، استثناءات الشبكة، وغيرها.
ثانياً: إدارة CI/CD وعمليات النشر والتوزيع
- تصميم وبناء وصيانة خطوط CI/CD (GitHub Actions / GitLab CI / Jenkins).
- كتابة وصيانة سكربتات النشر وسكربتات البناء الآلي وإدارة المتغيرات البيئية وإجراءات إصدار الإصدارات.
- مسؤول عن استراتيجيات النشر لبيئات الاختبار / UAT / الإنتاج واستراتيجيات التراجع (Rollback) والنشر الأزرق-الأخضر / النشر التدريجي.
- التعاون مع فريق التطوير في عمليات النشر اليومية والإصلاحات الطارئة وإدارة التكوين.
ثالثاً: استقرار النظام وتوفره (مجال SRE)
- إنشاء نظام مراقبة للتطبيقات (Prometheus، Grafana، ELK، CloudWatch).
- مسؤول عن إنشاء نظام الإنذار: استهلاك CPU/الذاكرة/القرص، استثناءات الخدمة، استثناءات الواجهات.
- مسؤول عن وضع وتنفيذ اتفاقيات مستوى الخدمة (SLA) وأهداف مستوى الخدمة (SLO) ومؤشرات مستوى الخدمة (SLI) لتعزيز استقرار النظام.
- إجراء تخطيط السعة بشكل دوري وتحسين الأداء واختبار الضغط على النظام.
رابعاً: الأمان وإدارة الصلاحيات
- إدارة حسابات الخوادم وحسابات منصة السحابة وأذونات مستودعات Git وأذونات أنظمة Jira/Wiki.
- إعداد/صيانة خادم القفز (Jump Server/Bastion) وتطبيق مبدأ أقل الامتيازات.
- صياغة سياسات الخط الأساسي للأمان وإجراء تحديثات التصحيحات وفحص الثغرات والتدقيق الأمني بشكل دوري.
- التعاون مع فريق الأمان/إدارة المخاطر لمعالجة الحوادث الأمنية (الهجمات العنيفة، حركة مرور غير طبيعية، ثغرات الخدمات، وغيرها).
خامساً: صيانة قواعد البيانات والبرمجيات الوسيطة
- صيانة خدمات MySQL / PostgreSQL / Redis / Kafka وغيرها من حيث النشر والنسخ الاحتياطي وتكوينات الماستر-سليف.
- تحسين أداء قاعدة البيانات، تحليل استعلامات SQL البطيئة، وتحسين إعدادات تجمع الاتصالات.
- تنفيذ استراتيجية النسخ الاحتياطي والنسخ الآلي، والتعافي من الكوارث في موقع بديل، وإجراء تمارين الاستعادة بشكل دوري.
سادساً: إدارة الوثائق والأصول
- الحفاظ على سجل الخوادم وسجل شهادات النطاق وقائمة الصلاحيات.
- كتابة وصيانة وثائق العمليات: تعليمات النشر، إجراءات الإصدار، سياسات الأمان، مخططات البنية.
- إدارة أصول العمليات: مواصفات الخوادم ولوحات المراقبة والمفاتيح وتكوينات البيئة ومخططات الشبكة.
سابعاً: بناء الفريق والعمليات
- مسؤول عن الإدارة اليومية وتدريب فريق العمليات.
- دفع تنفيذ عمليات تغيير الإنتاج، ونظام الإصدار، ونظام إدارة الصلاحيات، ونظام التعافي من الكوارث.
- التنسيق بين فريق البحث والتطوير وفريق التطوير الخلفي وقسم DBA وفريق الأمان لمعالجة الأعطال الطارئة.
المؤهلات المطلوبة
- إجادة إدارة نظام Linux، وسكربتات Shell، وأساسيات الشبكات (المستوى الثالث/الرابع/السابع).
- الإلمام بصيانة المنصات السحابية: OCI / AWS.
- إتقان Nginx وSSL والوكيل العكسي وKeepalived وتوازن الأحمال.
- الإلمام بـ Docker/Kubernetes (على الأقل إجادة Docker وCompose).
- الإلمام بخطوط CI/CD (GitHub Actions / GitLab CI / Jenkins).
- إجادة أساسيات MySQL والتكرار (Master-Slave) والنسخ الاحتياطي والاستعادة وتحسين الأداء.
- الإلمام بواحدة على الأقل من البرمجيات الوسيطة الشائعة مثل Redis أو Kafka أو RabbitMQ.
- خبرة في إنشاء أنظمة المراقبة: Prometheus / Grafana / ELK / Loki.
مزايا إضافية
- قدرة قوية على التحليل المنطقي والتشخيص السريع، والقدرة على معالجة الحوادث في بيئة الإنتاج بشكل مستقل.
- امتلاك رؤية شاملة لنظام العمليات: المراقبة، الإنذار، الأمان، الصلاحيات، العمليات.
- مهارات توثيق جيدة، والقدرة على تنظيم جداول الأصول ومخططات الشبكة وإجراءات العمليات.
- مهارات تواصل قوية وقدرة على التعاون بين الفرق.
- خبرة في عمليات الصيانة في قطاعات المالية أو البورصات أو البلوكشين.
- الإلمام بتصميم البنية عالية التوافر وعالية الحمل.