مهندس برمجيات 10x
10x Software Engineer
لوسيدياالقاهرةمنذ يومين
دوام كامل
لوسيديا
وصف الوظيفة
لوسيديا هي منصة إدارة تجربة العملاء (CXM) المدعومة بالذكاء الاصطناعي والرائدة في منطقة الشرق الأوسط وشمال أفريقيا، وتمكّن المؤسسات من فهم العملاء والتعامل معهم وخدمتهم عبر القنوات الرقمية بكفاءة عالية. مع توجهنا نحو مرحلة IPO، نعيد بناء أجزاء من منصتنا لتحقيق: موثوقية قصوى (هندسة مدفوعة بـ SLO)، معالجة موزعة عالية الحجم (مليارات نقاط البيانات)، معمارية موجهة نحو الذكاء الاصطناعي (LLM والذكاء في الوقت الفعلي).
لا نحسّن من أجل الألقاب، بل نحسّن من أجل التأثير! سواء كنت مبتدئاً أو متقدماً، لا يهم، وما يهم هو قدرتك على التحرك بسرعة أكبر والتفكير بعمق أكثر من متوسط المهندسين. نعمل بامتلاك شديد للمسؤولية. المشاكل لا تنتمي إلى فريق أو تذكرة بل تنتمي إلى من يراها. الشخص المناسب لهذا الدور لا يمر بجانب نظام معطوب. إذا كان شيء ما يفشل، فأنت تصلحه حتى لو لم تكن "وظيفتك".
ما سوف تعمل عليه:
الخدمات الدقيقة والمعمارية الموزعة:
تصميم تشغيل خطوط معالجة عالية الإنتاجية وموجهة للأحداث عبر نظام يضم أكثر من 100 خدمة دقيقة يتعامل مع مليارات نقاط البيانات.
بناء وتوسيع أنظمة المراسلة الموزعة باستخدام RabbitMQ وإدارة الضغط الخلفي وتوسيع المستهلكين وصحة الطابور.
تطوير والحفاظ على طبقات بوابة API مع التوجيه المتقدم (المنبع المتعدد وتقسيم حركة المرور وعزل البيئة).
تصميم معمارية SSO والاتحاد الموحد للعملاء الحقيقيين مع دعم توجيه IdP المتعدد بدون ارتباط بالخدمات الأساسية.
تحديد حدود الخدمة النظيفة عبر خطوط المدخلات والمعالجة والتسليم التي تمتد عبر Ruby و Python.
الأداء والأنظمة:
تشخيص وحل مشاكل الإنتاج المعقدة (مثل الجمود وحتى استنزاف الطابور وتشبع تجمع الاتصالات) والقضاء على الأسباب الجذرية.
تحسين PostgreSQL لأعباء العمل الثقيلة للكتابة وإدارة التنازع وتصميم المخطط والمشغلات وتوسيع الاتصلات.
تصميم وضبط Elasticsearch للبحث والفهرسة والملاءمة العربية في الوقت الفعلي بكفاءة عالية.
إجراء المقارنات المستنيرة بين معمارية متعددة العمليات والمعمارية غير المتزامنة بناءً على خصائص العبء.
الملاحظة والموثوقية:
بناء والحفاظ على الملاحظة عبر نظام كبير الحجم باستخدام Grafana و Loki والتتبع الموزع وـ SLOs.
امتلاك حوادث الإنتاج من البداية للنهاية، وتتبع الأعطال عبر الطوابير وأنظمة البحث والتكاملات الخارجية.
قيادة تحليل السبب الجذري وتنفيذ تدابير وقائية عبر خطوط الخدمات المتعددة.
بناء أدوات داخلية تحسّن من سرعة الهندسة والأتمتة وبوابات النشر وفرض المراجعة.
تحويل المبادئ المعمارية إلى معايير قابلة للتنفيذ وحواجز حماية، وليس مجرد توثيق.
تطور المنصة:
قيادة فصل المنصة وعزل الخدمات عبر النظام.
المساهمة في هجرة Kubernetes وحداثة البنية التحتية.
توحيد وتحسين خطوط CI/CD عبر الخدمات.
المكدس: Ruby on Rails و Python و PostgreSQL و Elasticsearch و Redis و RabbitMQ و Kubernetes و AWS / GCP و APISIX و Grafana + Loki.
ما نبحث عنه:
أساس قوي في الأنظمة الموزعة. أنت تفهم أوضاع الفشل قبل كتابة السطر الأول.
خبرة عملية مع معمارية موجهة للأحداث وطوابير الرسائل في الإنتاج.
ارتياح عميق مع التزامن والضغط الخلفي وتحمل الأخطاء.
سجل تعقب في تصحيح الأخطاء في مشاكل الإنتاج المعقدة — وليس مجرد إصلاحها بل منع حدوثها.
خبرة مع Rails أو Python backends بحجم معنوي.
أنت تحسّن من الأنظمة التي لم يُطلب منك لمسها.
هذا الدور مناسب بشكل قوي إذا كنت...
تقرأ وتفهم قاعدة الكود الموجودة بحلول الأسبوع الأول.
ترى نظام معطوب وتصلحه قبل أن يطلب منك أحد.
لديك آراء قوية حول المعمارية ويمكنك دعمها بالبيانات.
تفكر في الأنظمة: الكمون والإنتاجية وأوضاع الفشل والتكلفة بكفاءة عالية.
تعامل التوثيق والاختبارات والملاحظة كأولويات غير قابلة للتفاوض وليست كتفكير لاحق.
شحن سريع بدون كسر الأشياء. السرعة والجودة ليسا مقايضة بالنسبة لك.
تتجاوز التوقعات باستمرار حيث يكون تحقيق المعيار أساسي وليس هدف.
جائع للتحديات الصعبة وتبحث بنشاط عن مشاكل على حافة حدودك.
تشعر بإحساس الاستعجالية التي لا تتطلب ضغط خارجي.
أعدت بناء أو استقرت على شيء كبير الحجم ويمكنك التحدث عنه بشكل ملموس.
لماذا لوسيديا:
حجم حقيقي مع مليارات الأحداث وليس فقط أنظمة لعبة.
تأثير مباشر على مستوى CTO والمستوى التنفيذي.
ما قبل IPO مع مسار واضح والعمل الذي تقوم به له تأثير حقيقي على العملاء.
Job Description
Lucidya is a leading AI-powered Customer Experience Management (CXM) platform in the MENA region, enabling enterprises to understand, engage, and serve customers across digital channels at scale. As we move toward IPO-scale, we are rebuilding parts of our platform to achieve: Extreme reliability (SLO-driven engineering) High-scale distributed processing (billions of data points) AI-native architecture (LLM + real-time intelligence) We don’t optimize for titles, we optimize for impact! Whether you are junior or senior doesn’t matter and what matters is your ability to move faster and think deeper than the average engineer. We operate with extreme ownership. Problems don’t belong to teams or tickets where they belong to whoever sees them. The right person for this role doesn’t walk past a broken system. If something is failing, you fix it even if it’s not “your job.” What You Will Work On Microservices & Distributed Architecture Design and operate high-throughput, event-driven pipelines across a 100+ microservice ecosystem handling billions of data points Build and scale distributed messaging systems with RabbitMQ, backpressure management, consumer scaling, and queue health Develop and maintain API gateway layers with advanced routing (multi-upstream, traffic splitting, environment isolation) Architect SSO and identity federation for enterprise clients, supporting multi-IdP routing with zero coupling to core services Define clean service boundaries across ingestion, processing, and delivery pipelines spanning Ruby and Python Performance & Systems Diagnose and resolve complex production issues (e.g., deadlocks, queue exhaustion, connection pool saturation) — and eliminate root causes Optimize PostgreSQL for heavy write workloads, contention management, schema design, triggers, and connection scaling Design and tune Elasticsearch for search, indexing, and real-time Arabic relevance at scale Make informed trade-offs between multi-process and async architectures based on workload characteristics Observability & Reliability Build and maintain observability across a large-scale system using Grafana, Loki, distributed tracing, and SLOs Own production incidents end-to-end, tracing failures across queues, search systems, and external integrations Lead root cause analysis and implement preventative measures across multi-service pipelines Build internal tooling that improves engineering velocity, automation, deployment gating, and review enforcement Turn architectural principles into enforceable standards and guardrails, not just documentation Platform Evolution Drive platform decoupling and service isolation across the system Contribute to Kubernetes migration and infrastructure modernization Standardize and improve CI/CD pipelines across services Stack Ruby on Rails · Python · PostgreSQL · Elasticsearch · Redis · RabbitMQ · Kubernetes · AWS / GCP · APISIX · Grafana + Loki What We Are Looking For Strong foundation in distributed systems. You understand failure modes before you write the first line Hands-on experience with event-driven architecture and message queues in production Deep comfort with concurrency, backpressure, and fault tolerance Track record debugging complex production issues — not just fixing them, preventing them Experience with Rails or Python backends at meaningful scale You improve systems you weren’t asked to touch This Role is a Strong Fit If You… Read and understand an existing codebase by week one See a broken system and fix it before anyone asks you to Have strong opinions about architecture and can back them up with data Think in systems: latency, throughput, failure modes, and cost at scale Treat documentation, tests, and observability as non-negotiable defaults and not afterthoughts Ship fast and without breaking things. Speed and quality are not a trade-off for you Consistently exceed expectations where meeting the bar is a floor, not a target Are hungry for hard challenges and actively seek problems at the edge of your limits Feel a sense of urgency that doesn’t require external pressure Have rebuilt or stabilised something significant and can talk about it concretely Why Lucidya Real scale with billions of events and not just toy systems Direct impact at CTO and executive level Pre-IPO with clear trajectory and your work has real impact on clients