הפרויקט: למערכת AI לשליפת מידע פנים-ארגוני. המערכת תאפשר לעובדי הארגון לתשאל מסמכים מורכבים בשפה טבעית, וכל זאת בתוך סביבת ענן סגורה ומאובטחת לחלוטין.
המטרה המרכזית שלך תהיה פיתוח צנרת הנתונים (Ingestion Pipeline) מקצה לקצה – החל משאיבת הנתונים, דרך כתיבת לוגיקת פירסור (Parsing) חכמה, ועד לאינדוקס בווקטור דאטה-בייס ושליפה מול מודל השפה.
דרישות חובה:
* ניסיון מוכח בפיתוח Backend ובניית שירותי Microservices (העדפה חזקה ל-Python, אך Node.js אפשרי גם כן).
* הנדסת נתונים ופירסור (Data Parsing) – יכולת מוכחת לכתוב קוד מותאם אישית לחילוץ וסידור טקסט מתוך קבצים לא מובנים או מובנים למחצה (אקסלים מורכבים ומרובי שורות, PDF, מסמכי Word).
* היכרות מעמיקה ומעשית עם ארכיטקטורת RAG (Retrieval-Augmented Generation), כולל שיטות Chunking, עבודה עם Embeddings ושילוב מודלים (OpenAI / Azure OpenAI).
* ניסיון בעבודה עם מסדי נתונים וקטוריים (Vector Databases), בדגש על הגדרת אינדקסים וסינון מטא-דאטה.
ניסיון ספציפי ב-Azure AI Search – יתרון משמעותי.
* ניסיון בעבודה בסביבת הענן של Azure, כולל פריסת קוד (Deploy) ל-Azure App Service.
* יכולת אינטגרציה מול APIs ארגוניים מאובטחים (כדוגמת Microsoft Graph API) לשאיבת קבצים מתוך סביבות SharePoint.
* יכולת עבודה עצמאית לחלוטין ברמת הפיתוח, "Hand-on" מלא, וחתירה לתוצאות מהירות בסביבת PoC.