دوام كامل
لوسيديا
وصف الوظيفة
لوسيديا هي منصة إدارة تجربة العملاء (CXM) الرائدة المدعومة بالذكاء الاصطناعي في منطقة الشرق الأوسط وشمال أفريقيا، وتمكّن المؤسسات من فهم العملاء والتواصل معهم وخدمتهم عبر القنوات الرقمية على نطاق واسع. مع توجهنا نحو حجم IPO، نعيد بناء أجزاء من منصتنا لتحقيق:
- الموثوقية الشديدة (الهندسة المدفوعة بـ SLO)
- معالجة موزعة عالية التوسع (مليارات نقاط البيانات)
- معمارية محلية للذكاء الاصطناعي (LLM + الذكاء في الوقت الفعلي)
نحن لا نحسّن العناوين، بل نحسّن التأثير! سواء كنت مبتدئاً أو كبيراً لا يهم، الأهم هي قدرتك على التحرك بسرعة أكبر والتفكير بعمق أكثر من متوسط المهندسين. نعمل بملكية شديدة. المشاكل لا تنتمي إلى الفرق أو التذاكر، بل تنتمي إلى من يراها. الشخص المناسب لهذا الدور لا يمر بجانب نظام معطوب. إذا كان شيء ما يفشل، فأنت تصلحه حتى لو لم تكن "وظيفتك".
ما ستعمل عليه:
الخدمات الدقيقة والمعمارية الموزعة
- تصميم وتشغيل خطوط معالجة عالية الإنتاجية وموجهة بالأحداث عبر نظام بيئي يضم أكثر من 100 خدمة دقيقة يتعامل مع مليارات نقاط البيانات
- بناء وتوسيع أنظمة المراسلة الموزعة مع RabbitMQ وإدارة المقاومة وتوسيع المستهلكين وصحة قائمة الانتظار
- تطوير والحفاظ على طبقات بوابة API مع التوجيه المتقدم (متعدد المنبع، تقسيم حركة المرور، عزل البيئة)
- بناء معمارية SSO واتحاد الهويات لعملاء المؤسسات، مما يدعم توجيه متعدد IdP بدون ربط بالخدمات الأساسية
- تحديد حدود خدمة نظيفة عبر خطوط أنابيب الاستقراء والمعالجة والتسليم التي تمتد عبر Ruby و Python
الأداء والأنظمة
- تشخيص وحل مشاكل الإنتاج المعقدة (مثل الجمود وتشبع قائمة الانتظار وتشبع مجموعة الاتصالات) - والقضاء على الأسباب الجذرية
- تحسين PostgreSQL لأعباء العمل الثقيلة للكتابة وإدارة النزاعات وتصميم المخطط والمشاعل وتوسيع الاتصالات
- تصميم وضبط Elasticsearch للبحث والفهرسة والصلة العربية في الوقت الفعلي على نطاق واسع
- اتخاذ خيارات مستنيرة بين معماريات العمليات المتعددة والمعماريات غير المتزامنة بناءً على خصائص عبء العمل
الملاحظة والموثوقية
- بناء والحفاظ على الملاحظة عبر نظام واسع النطاق باستخدام Grafana و Loki والتتبع الموزع و SLOs
- امتلاك حوادث الإنتاج من البداية إلى النهاية، وتتبع الأعطال عبر قوائم الانتظار وأنظمة البحث والتكاملات الخارجية
- قيادة تحليل السبب الجذري وتطبيق تدابير وقائية عبر خطوط أنابيب متعددة الخدمات
- بناء أدوات داخلية تحسن سرعة الهندسة والتشغيل الآلي وبوابات النشر وفرض المراجعة
- تحويل المبادئ المعمارية إلى معايير وحراس قابلة للتطبيق، وليس فقط الوثائق
تطور المنصة
- قيادة فصل المنصة وعزل الخدمات عبر النظام
- المساهمة في هجرة Kubernetes وحداثة البنية الأساسية
- توحيد وتحسين خطوط أنابيب CI/CD عبر الخدمات
المكدس: Ruby on Rails · Python · PostgreSQL · Elasticsearch · Redis · RabbitMQ · Kubernetes · AWS / GCP · APISIX · Grafana + Loki
ما نبحث عنه:
- أساس قوي في الأنظمة الموزعة. أنت تفهم أوضاع الفشل قبل أن تكتب السطر الأول
- خبرة عملية مع معمارية موجهة بالأحداث وقوائم الانتظار في الإنتاج
- الراحة العميقة مع التزامن والمقاومة وتحمل الأعطال
- سجل تتبع في تصحيح المشاكل المعقدة في الإنتاج - ليس فقط إصلاحها، بل منعها
- الخبرة مع backends Rails أو Python على نطاق ذي معنى
- أنت تحسّن الأنظمة التي لم يطلب منك لمسها
هذا الدور مناسب بقوة إذا كنت...
- اقرأ وافهم قاعدة الكود الموجودة بحلول الأسبوع الأول
- ترى نظاماً معطوباً وتصلحه قبل أن يطلب منك أحد ذلك
- لديك آراء قوية حول المعمارية ويمكنك دعمها بالبيانات
- تفكر في الأنظمة: الكمون والإنتاجية وأوضاع الفشل والتكلفة على نطاق واسع
- تعامل الوثائق والاختبارات والملاحظة على أنها افتراضيات غير قابلة للتفاوض وليست متأخرة الأفكار
- شحن بسرعة وبدون كسر الأشياء. السرعة والجودة لا تشكل مقايضة بالنسبة لك
- تتجاوز التوقعات باستمرار حيث يكون تحقيق المعيار أرضية وليس هدفاً
- جائع للتحديات الصعبة وتبحث بنشاط عن المشاكل في حدود حدودك
- تشعر بالإلحاح الذي لا يتطلب ضغطاً خارجياً
- أعادت بناء أو استقرار شيء مهم ويمكنك التحدث عنه بشكل ملموس
لماذا لوسيديا:
- حجم حقيقي مع مليارات الأحداث وليس فقط الأنظمة الخيالية
- التأثير المباشر على مستوى CTO والمستوى التنفيذي
- IPO قبل مع مسار واضح وعملك له تأثير حقيقي على العملاء
Job Description
Lucidya is a leading AI-powered Customer Experience Management (CXM) platform in the MENA region, enabling enterprises to understand, engage, and serve customers across digital channels at scale. As we move toward IPO-scale, we are rebuilding parts of our platform to achieve: Extreme reliability (SLO-driven engineering) High-scale distributed processing (billions of data points) AI-native architecture (LLM + real-time intelligence) We don’t optimize for titles, we optimize for impact! Whether you are junior or senior doesn’t matter and what matters is your ability to move faster and think deeper than the average engineer. We operate with extreme ownership. Problems don’t belong to teams or tickets where they belong to whoever sees them. The right person for this role doesn’t walk past a broken system. If something is failing, you fix it even if it’s not “your job.” What You Will Work On Microservices & Distributed Architecture Design and operate high-throughput, event-driven pipelines across a 100+ microservice ecosystem handling billions of data points Build and scale distributed messaging systems with RabbitMQ, backpressure management, consumer scaling, and queue health Develop and maintain API gateway layers with advanced routing (multi-upstream, traffic splitting, environment isolation) Architect SSO and identity federation for enterprise clients, supporting multi-IdP routing with zero coupling to core services Define clean service boundaries across ingestion, processing, and delivery pipelines spanning Ruby and Python Performance & Systems Diagnose and resolve complex production issues (e.g., deadlocks, queue exhaustion, connection pool saturation) — and eliminate root causes Optimize PostgreSQL for heavy write workloads, contention management, schema design, triggers, and connection scaling Design and tune Elasticsearch for search, indexing, and real-time Arabic relevance at scale Make informed trade-offs between multi-process and async architectures based on workload characteristics Observability & Reliability Build and maintain observability across a large-scale system using Grafana, Loki, distributed tracing, and SLOs Own production incidents end-to-end, tracing failures across queues, search systems, and external integrations Lead root cause analysis and implement preventative measures across multi-service pipelines Build internal tooling that improves engineering velocity, automation, deployment gating, and review enforcement Turn architectural principles into enforceable standards and guardrails, not just documentation Platform Evolution Drive platform decoupling and service isolation across the system Contribute to Kubernetes migration and infrastructure modernization Standardize and improve CI/CD pipelines across services Stack Ruby on Rails · Python · PostgreSQL · Elasticsearch · Redis · RabbitMQ · Kubernetes · AWS / GCP · APISIX · Grafana + Loki What We Are Looking For Strong foundation in distributed systems. You understand failure modes before you write the first line Hands-on experience with event-driven architecture and message queues in production Deep comfort with concurrency, backpressure, and fault tolerance Track record debugging complex production issues — not just fixing them, preventing them Experience with Rails or Python backends at meaningful scale You improve systems you weren’t asked to touch This Role is a Strong Fit If You… Read and understand an existing codebase by week one See a broken system and fix it before anyone asks you to Have strong opinions about architecture and can back them up with data Think in systems: latency, throughput, failure modes, and cost at scale Treat documentation, tests, and observability as non-negotiable defaults and not afterthoughts Ship fast and without breaking things. Speed and quality are not a trade-off for you Consistently exceed expectations where meeting the bar is a floor, not a target Are hungry for hard challenges and actively seek problems at the edge of your limits Feel a sense of urgency that doesn’t require external pressure Have rebuilt or stabilised something significant and can talk about it concretely Why Lucidya Real scale with billions of events and not just toy systems Direct impact at CTO and executive level Pre-IPO with clear trajectory and your work has real impact on clients