دوام كامل10+ سنوات خبرةبكالوريوس
وصف الوظيفة
مهندس تحليل أول - إدارة المشكلات و إدارة استعادة الأعمال
مسؤول عن قيادة قسم إدارة المشكلات و إدارة الاستجابة للحوادث لتخفيف وتقليل تأثير وتكرار الحوادث، وتحسين استقرار الخدمات، وحماية النتائج التجارية. يطبق هذا الدور مبادئ إدارة المشكلات في الإصدار الرابع من ITIL، والتحليلات القائمة على البيانات، والتحليلات المدعومة بالذكاء الاصطناعي لتحديد المشكلات النظامية، وقيادة تحليلات الأسباب الجذرية الفعالة، وضمان تنفيذ الإجراءات التصحيحية والوقائية وقياسها.
من خلال الاستفادة من مؤشرات الأداء الرئيسية، والتحليلات، وممارسات التحسين المستمر، يتعاون الدور مع مالكي الخدمات، وأفرقة التطبيقات، وقيادات تكنولوجيا المعلومات لتحسين المرونة التشغيلية، وزيادة الشفافية، وتحسين جودة الخدمات بشكل مستمر.
المسؤوليات:
أ) إدارة المشكلات (استباقية و تفاعلية)
- مواءمة أنشطة إدارة المشكلات مع ممارسات ITIL v4 من خلال تعزيز التمييز بين الحوادث والمشكلات، والتركيز على خلق القيمة من خلال منع الحوادث المتكررة وتقليل تأثير الأعمال.
- تعزيز إدارة المشكلات الاستباقية من خلال الاستفادة من تحليل الاتجاهات، وبيانات الأحداث، وأنماط الحوادث التاريخية لتحديد المشكلات النظامية وتصنيفها، وذلك تماشياً مع مبادئ الوقاية والتحسين المستمر في ITIL v4.
- توحيد تحليل الأسباب الجذرية باستخدام تقنيات متوافقة مع ITIL v4 (مثل 5 Whys, Ishikawa) لضمان تحديد الأسباب الجذرية والعوامل المساهمة والإجراءات التصحيحية والوقائية القابلة للقياس.
- الاستفادة من التحليلات المدعومة بالذكاء الاصطناعي لاكتشاف الأنماط المتكررة، والعلاقات، ومؤشرات التحذير المبكر في بيانات الحوادث والأحداث، مما يمكن من تحديد المشكلات بشكل تنبؤي والتخفيف من المخاطر في وقت مبكر.
- تعزيز الحوكمة والمساءلة من خلال ضمان تعيين مالك واضح لكل سجل مشكلة، وتحديد النتائج، والتحقق من الإغلاق بناءً على فعالية الإجراءات الوقائية.
- دمج التحسين المستمر من خلال تغذية الدروس المستفادة، والتحليلات المدعومة بالذكاء الاصطناعي، ونتائج مؤشرات الأداء الرئيسية بشكل منهجي في الممارسات التشغيلية تماشياً مع نموذج التحسين المستمر في ITIL v4.
ب) التحليلات، والتقارير، والأدوات
- تعزيز تقارير إدارة المشكلات في ServiceNow من خلال تحديد مؤشرات الأداء الرئيسية المتوافقة مع ITIL v4 مثل معدل الحوادث المتكررة، وصحة تراكم المشكلات، ووقت دورة تحليل الأسباب الجذرية، وفعالية الإجراءات الوقائية.
- استخدام التحليلات المدعومة بالذكاء الاصطناعي ولوحات المعلومات لإبراز الاتجاهات، والتنبؤ بالخدمات عالية المخاطر، ودعم الأولوية المستندة إلى البيانات للمشكلات.
- إنشاء لوحات معلومات في ServiceNow لتوفير رؤية شفافة ودوريه لأداء إدارة المشكلات وتأثير الأعمال.
- تعزيز إدارة المعرفة من خلال الحفاظ على سجلات دقيقة للمشكلات، والأخطاء المعروفة، والدروس المستفادة لدعم التشخيص والوقاية الأسرع.
ج) الحوكمة، والامتثال، والتحسين المستمر
- ضمان مواءمة حوكمة إدارة المشكلات مع المبادئ التوجيهية لـ ITIL v4، والمعايير الداخلية، ومتطلبات المراجعة.
- استخدام اتجاهات مؤشرات الأداء الرئيسية والتحليلات المدعومة بالذكاء الاصطناعي لتحديد فرص التحسين وتصنيف مبادرات التحسين المستمر للخدمات.
- تعزيز التعاون عبر الوظائف والالتزام بالعمليات من خلال المراجعات المنتظمة، والتدريب، وتقييمات النضج.
- التطور المستمر لممارسات إدارة المشكلات من خلال دمج أفضل الممارسات في الصناعة، والتشغيل الآلي، والتحليلات التنبؤية.
د) إدارة الاستجابة للحوادث
- امتلاك وتوجيه برنامج إدارة استعادة الأعمال في تكنولوجيا المعلومات على مستوى العالم في المنظمة.
- قيادة الاستجابة الفعالة للحوادث عالية الخطورة (P1/P2) تماشياً مع حوكمة إدارة الحوادث والاستعادة.
- ضمان المساءلة الكاملة لتنفيذ الاستعادة، وجداول الحوادث، والسجلات الدقيقة في ServiceNow.
- إدارة صرامة التصعيد، وقرارات الاستعادة، ومشاركة أصحاب المصلحة لتقليل تأثير الأعمال.
- وضع وتنفيذ معايير إدارة الخدمات في تكنولوجيا المعلومات، وامتثال معايير MOS، وإدارة الاستعادة عبر الفرق.
- امتلاك تحسينات إدارة الحوادث ودفع MOS نحو تقليل الحوادث.
- تقديم تواصل واضح وهادئ وسلطة خلال الحوادث الرئيسية وأحداث الاستعادة.
- قيادة مراجعات الاستعادة بعد الحوادث، وضمان معالجة الأسباب الجذرية وإزالة الفجوات في الاستعادة.
- قيادة التحسين المستمر لعمليات الاستعادة، والتوثيق، والاستعداد من خلال الدروس المستفادة.
- امتلاك مقاييس الاستعادة والحوادث (MTTR, SLA, حوادث متكررة) وترجمة الأفكار إلى تحسينات في المرونة.
- العمل كقائد وحيد ومستشار موثوق لاستعادة الأعمال والاستعداد للحوادث عبر تكنولوجيا المعلومات.
- توفير القيادة الوظيفية لمحللي تكنولوجيا المعلومات الذين يدعمون إدارة الحوادث والاستعادة.
- تدريب وتوجيه أعضاء الفريق، وبناء العمق والخلافة.
- العمل كنقطة اتصال رئيسية للقيادات العليا، وأصحاب المصلحة في الأعمال، والموردين، وأفرقة المراجعة.
- التأثير على الفرق العالمية عبر التطبيقات، والبنية التحتية، والشبكة، والأمن دون سلطة مباشرة.
- رعاية ثقافة الملكية، والمساءلة، والتعلم.
ه) القيادة و إدارة أصحاب المصلحة
- توفير القيادة الوظيفية لمحللي تكنولوجيا المعلومات الذين يدعمون إدارة الحوادث والاستعادة.
- تدريب وتوجيه أعضاء الفريق، وبناء العمق والخلافة.
- العمل كنقطة اتصال رئيسية للقيادات العليا، وأصحاب المصلحة في الأعمال، والموردين، وأفرقة المراجعة.
- التأثير على الفرق العالمية عبر التطبيقات، والبنية التحتية، والشبكة، والأمن دون سلطة مباشرة.
- رعاية ثقافة الملكية، والمساءلة، والتعلم.
المؤهلات المطلوبة:
- درجة البكالوريوس في علوم الكمبيوتر، أو نظم المعلومات، أو تكنولوجيا المعلومات، أو إدارة الأعمال.
- 10+ سنوات من الخبرة في عمليات تكنولوجيا المعلومات/إدارة الخدمات في تكنولوجيا المعلومات مع تركيز قوي على ممارسات إدارة الخدمات في تكنولوجيا المعلومات، وإدارة الحوادث، وإدارة المشكلات، والممارسات ذات الصلة في ITIL.
- خبرة عملية في قيادة إدارة المشكلات وتحليل الأسباب الجذرية، بما في ذلك تسهيل جلسات تحليل الأسباب الجذرية ومتابعة الإجراءات الوقائية.
- ...
Job Description
Job Description – Lead IT Analyst – Problem Management & BRM
The Lead IT Analyst is responsible for leading the Problem Management & Incident Response Management area to proactively and reactively reduce and mitigate the impact and recurrence of incidents, improve service stability, and protect business outcomes. The role applies ITIL v4 Problem Management principles , data‑driven analysis, and AI‑enabled insights to identify systemic issues, drive effective root‑cause analysis, and ensure corrective and preventive actions are implemented and measured. By leveraging KPIs, analytics, and continual improvement practices , the role partners with Service Owners, Application teams, and IT leadership to enhance operational resilience, increase transparency, and continuously improve service quality
Responsibilities
A) Problem Management (Proactive & Reactive)
Align Problem Management activities to ITIL v4 practices by reinforcing the distinction between incidents and problems, focusing on value creation through prevention of recurring incidents and reduction of business impact.
Strengthen proactive Problem Management by leveraging trend analysis, event data, and historical incident patterns to identify and prioritize systemic issues, in alignment with ITIL v4’s prevention and continual improvement principles.
Standardize Root Cause Analysis (RCA) using ITIL v4–aligned techniques (e.g., 5 Whys, Ishikawa) to ensure consistent identification of root causes, contributing factors, and measurable corrective and preventive actions.
Leverage AI-driven analytics to detect recurring patterns, correlations, and early warning indicators across incident and event data, enabling predictive identification of problems and earlier risk mitigation.
Reinforce governance and accountability by ensuring each problem record has a clearly assigned owner, defined outcomes, and verified closure based on effectiveness of preventive actions.
Embed continual improvement by systematically feeding lessons learned, AI insights, and KPI results back into operational practices in line with ITIL v4’s Continual Improvement Model.
B) Analytics, Reporting & Tooling
Enhance ServiceNow Problem Management reporting by defining ITIL v4–aligned KPIs such as repeat incident rate, problem backlog health, RCA cycle time, and preventive action effectiveness.
Utilize AI-enabled analytics and dashboards to surface trends, predict high-risk services, and support data-driven prioritization of problems.
Create ServiceNow dashboards to provide transparent, role-based visibility into Problem Management performance and business impact.
Strengthen knowledge management by maintaining accurate problem records, known errors, and lessons learned to support faster diagnosis and prevention.
C) Governance, Compliance & Continuous Improvement
Ensure Problem Management governance aligns with ITIL v4 guiding principles, internal standards, and audit requirements.
Use KPI trends and AI insights to identify improvement opportunities and prioritize continual service improvement initiatives.
Promote cross-functional collaboration and process adherence through regular reviews, coaching, and maturity assessments.
Continuously evolve Problem Management practices by incorporating industry best practices, automation, and predictive analytics.
D) Incident Response Management (IRM)
Own and drive the IT Business Recovery Management (BRM) program globally across the organization.
Drive effective leadership of high‑severity incidents (P1/P2) in alignment with Incident & Recovery Management governance.
Ensure end‑to‑end accountability for recovery execution, incident timelines, and accurate records in ServiceNow.
Govern escalation rigor, recovery decisions, and stakeholder engagement to minimize business impact.
Establish and enforce ITSM standards, MOS adherence, and recovery governance across teams.
Own Incident management improvements and drive MOS towards the reduction of the incidents.
Provide clear, calm, and authoritative communication to senior leadership during major incidents and recovery events.
Lead post‑incident recovery reviews, ensuring root causes are addressed and recovery gaps are eliminated.
Drive continuous improvement of recovery processes, documentation, and readiness through lessons learned.
Own recovery and incident metrics (MTTR, SLA, repeat incidents) and translate insights into resilience improvements.
Act as the single‑point leader and trusted advisor for Business Recovery and Incident Readiness across IT.
Provide functional leadership to IT Analysts supporting Incident and Recovery Management.
Coach and mentor team members, building depth and succession.
Act as a primary point of contact for senior leadership, business stakeholders, vendors, and audit teams.
Influence global teams across applications, infrastructure, network, and security without direct authority.
Champion a culture of ownership, accountability, and learning.
E) Leadership & Stakeholder Management
Provide functional leadership to IT Analysts supporting Incident and Recovery Management.
Coach and mentor team members, building depth and succession.
Act as a primary point of contact for senior leadership, business stakeholders, vendors, and audit teams.
Influence global teams across applications, infrastructure, network, and security without direct authority.
Champion a culture of ownership, accountability, and learning.
Required Qualifications
Bachelor’s degree in computer science, Information Systems, IT, or Business Management.
10+ years of experience in IT/ITSM operations with strong focus on ITSM practices, Incident management, Problem Management and related ITIL practices.
Hands-on experience leading Problem Management and Root Cause Analysis, including facilitation of RCA sessions and preventive action follow-through.
Strong experience with ServiceNow Problem Management, reporting, dashboards, and performance analytics.
Demonstrated ability to use KPIs, trend analysis, and data-driven insights (including AI-supported analytics) to drive continual improvement.
Excellent communication and stakeholder management skills, with the ability to influence cross-functional teams.
Preferred Qualifications
ITIL v4 Foundations (or higher) and relevant ServiceNow certifications.
Experience with Scrum, Kanban, Agile, Waterfall methodologies.
Strong customer service orientation; advanced analytical and troubleshooting skills.
Familiarity with modern DevOps practices, AI, and predictive analytics for operations.
المهارات المطلوبة
إدارة المشكلاتتحليل الأسباب الجذريةالتحليلات المدعومة بالذكاء الاصطناعيإدارة الحوادثإدارة استعادة الأعمالإدارة الخدمات في تكنولوجيا المعلوماتITILالتحسين المستمرالقيادةإدارة أصحاب المصلحة
