سلة

مهندس ضمان الجودة الأول II (الذكاء الاصطناعي والبيانات)

Senior Quality Engineer II (AI & Data)

سلةمكة المكرمةمنذ يومين
دوام كامل
سلة

سلة

وصف الوظيفة

نظرة عامة على الدور: كمهندس ضمان جودة أول في فريق الذكاء الاصطناعي، ستكون مسؤولاً عن تحديد وتنفيذ استراتيجية الجودة لمنتجاتنا المدفوعة بالذكاء الاصطناعي. ستعمل على تقاطع هندسة البيانات وتطوير التطبيقات الأمامية، مما يضمن أن نماذج التعلم الآلي لدينا موثوقة، وأن خطوط أنابيب البيانات دقيقة، والتجربة النهائية للمستخدم سلسة. المسؤوليات: - التحقق من خطوط أنابيب البيانات: اختبار سلامة عمليات البث والتحويل لضمان تدريب النماذج على مجموعات بيانات عالية الجودة. - اختبار واجهات برمجية التطبيقات والنماذج: إجراء اختبار عميق للواجهة البرمجية باستخدام أدوات مثل APIDog للتحقق من استجابات النموذج، والتعامل مع حالات حدية معقدة مثل معاملات القيمة الصفرية أو الوصول غير المصرح به. - دقة مخرجات نماذج التوليد: تحديد وتطبيق أطر العمل للتقييم لقياس جودة مخرجات الذكاء الاصطناعي التوليدي - بما في ذلك الصلة والدقة الواقعية والترابط ومعدل الهلوسة - باستخدام تقنيات مثل LLM-as-a-judge والتسجيل بمشاركة الإنسان ومجموعات المقاييس الآلية. - التحقق من استجابات وكلاء الذكاء الاصطناعي: تصميم استراتيجيات اختبار لتقييم صحة وموثوقية استجابات الذكاء الاصطناعي الوكيلة، تغطي دقة استدعاء الأدوات وسلامة التفكير متعدد الخطوات ومعدل إكمال الهدف والتعامل الرشيق مع الفشل للمدخلات الخارجة عن النطاق أو الخصومة. - الاختبار الأمني: تحديد نشط للثغرات مثل اعتراض الطلبات ومعالجة الأسعار لحماية النظام بما في ذلك حقن الموجهات ومحاولات الكسر المحددة لأسطح الذكاء الاصطناعي التوليدية. - أتمتة واجهة المستخدم: بناء والحفاظ على مجموعات أتمتة قابلة للتوسع باستخدام أدوات منخفضة التعقيد مثل mabl، بهدف تحقيق نسبة مئوية عالية من تغطية اختبار Mabl. - الدعوة إلى أدوات الذكاء الاصطناعي: تعزيز استخدام مساعدات الذكاء الاصطناعي مثل Jira Rovo لتحليل المتطلبات وإنشاء حالات الاختبار لزيادة سرعة الفريق. - تحليل السبب الجذري: قيادة عملية تحليل السبب الجذري لأخطاء الإنتاج والتذاكر المرفوضة من المطورين لتحسين مستمر لـ "تعريف الانتهاء". الخبرة والمتطلبات: - الخبرة الأولى: 8+ سنوات من الخبرة ذات الصلة - كفاءة البيانات: مهارات SQL قوية وخبرة في اختبار التطبيقات الثقيلة بالبيانات أو نماذج التعلم الآلي. - إتقان الأتمتة: الكفاءة في أدوات الأتمتة (مثل Selenium أو mabl أو Playwright) - عقلية الأمان: فهم مبادئ OWASP والخبرة العملية في اختبار الأمان (اعتراض الطلبات وتتبع التسميات). - المعرفة المجالية: الخبرة في التجارة الإلكترونية وتحليل تدفقات العملاء الحرجة مفضلة جداً.

Job Description

Role Overview: As a Senior Quality Engineer on the AI Team , you will be responsible for defining and executing the quality strategy for our AI-driven products. You will work at the intersection of data engineering and frontend application development, ensuring that our machine learning models are reliable, our data pipelines are accurate, and the final user experience is seamless. Responsibilities: Data Pipeline Validation: Test the integrity of data ingestion and transformation processes to ensure models are trained on high-quality datasets. API & Model Testing: Conduct deep API testing using tools like APIDog to validate model responses, handling complex edge cases such as zero-value parameters or unauthorized access. Generative Model Output Accuracy: Define and implement evaluation frameworks to measure the quality of generative AI outputs — including relevance, factual accuracy, coherence, and hallucination rate — using techniques such as LLM-as-a-judge, human-in-the-loop scoring, and automated benchmark suites. AI Agent Response Validation: Design test strategies to assess the correctness and reliability of agentic AI responses, covering tool-call accuracy, multi-step reasoning integrity, goal completion rate, and graceful failure handling for out-of-scope or adversarial inputs. Security Testing: Proactively identify vulnerabilities like request interception and price manipulation to safeguard the system including prompt injection and jailbreak attempts specific to generative AI surfaces. UI Automation: Build and maintain scalable automation suites using low-code tools like mabl, aiming for high Mabl Test Coverage %. AI Tooling Advocacy: Champion the use of AI assistants like Jira Rovo for requirement analysis and test case generation to increase team velocity. Root Cause Analysis (RCA): Lead the RCA process for production bugs and developer-rejected tickets to continuously improve the "Definition of Done". Senior Experience: 8+ years of relevant work experience Data Proficiency: Strong SQL skills and experience testing data-heavy applications or ML models. Automation Mastery: Proficiency in automation tools (e.g., Selenium, mabl, Playwright) Security Mindset: Understanding of OWASP principles and practical experience in security testing (request interception, label tracking). Domain Knowledge: Experience in e-commerce and critical customer-flow analysis is highly preferred.
مهندس ضمان الجودة الأول II (الذكاء الاصطناعي والبيانات) - سلة