AI (Generative AI) Engineer Roadmap

--

AI 工程師分為 3 個階段,如圖所示,您在此路線圖中從左到右,即從初級到中級再到高級。

AI Engineer Roadmap

初級 ( <= 1 個月) — 構建基本應用程式以學習使用 LLM API,為您的應用程式仔細設計提示並使用開源LLMs。

中級(~ 2 個月) — 使用 Retreival Augmented Generation (RAG) 深入構建更多上下文感知的高級應用程式。瞭解向量資料庫以及如何使用向量資料庫。學習使用LLMs和工具構建代理。

高級(~ 3 個月) — 掌握應用程式構建後,學習使用 LLMOps 在生產環境中部署、優化和管理LLM支援的應用程式。瞭解如何微調預訓練模型,以高效、低成本地適應下游應用。

初級
了解基礎LLM知識 — — 基礎 LLM 知識、知道 ChatGPT 是如何運作。
如何編寫提示(prompt)提升 LLM 輸出品質。
瞭解如何使用 API 的資料,瞭解如何使用 JSON 數據。
學習調用閉源模型和開源LLM模型、函數調用、傳遞提示和解析回應。
學習從對話中管理上下文長度。
學習建立和自動化一系列操作 — 例如: Langchain、Llamaindex等。
使用 Gradio 或 Streamlit 進行 POC 或 Demo。
部署應用程式讓使用者訪問 — 在 HuggingFace Space 或 Streamlit 雲上進行基本部署。
多模態生成 — 使用 HuggingFace transformer 套件產生程式、圖像、音訊。

中級
瞭解 Embedding 和向量資料庫。
瞭解如何將向量資料庫用於應用程式內。
構建檢索增強生成 (RAG) — 可以與知識庫聊天。
進階RAG,例如子問題查詢,該搜尋可以在搜尋多個資料源後提供回應。
建構 Agent, 用於完成一項大任務的反覆運算工作流。
構建多個 Agent,以提供更好的解決方案。
使用多個 Agent 實現自動化 — Autogen 和 Crew AI
評估RAG — RAGA 框架。
管理資料庫、檢索、部署完整的應用程式、版本控制、日誌記錄和監控模型行為。

高級
LLMs針對特定領域的知識和量身定製的回應(如醫學研究、金融研究、法律分析)進行微調。
整理數據集並設計 (ETL pipelining) 以進行模型微調。
評估和基準測試模型性能
LLMOps — 構建具有模型註冊表、可觀測性和自動化測試的完整端到端的管道。
構建多模態應用程式 — 使用文字和圖像進行混合語義搜索
構建 SDK、包和自訂解決方案,以支援其他開發人員
使用提示駭客攻擊等技術保護您的 AI 應用程式,並通過檢查漏洞和潛在風險來採取防禦措施。

參考資料: https://github.com/dswh/ai-engineer-roadmap

--

--