AI (Generative AI) Engineer Roadmap

Jun 2, 2024

AI 工程師分為 3 個階段，如圖所示，您在此路線圖中從左到右，即從初級到中級再到高級。

初級（ <= 1 個月） — 構建基本應用程式以學習使用 LLM API，為您的應用程式仔細設計提示並使用開源LLMs。
中級（~ 2 個月） — 使用 Retreival Augmented Generation （RAG）深入構建更多上下文感知的高級應用程式。瞭解向量資料庫以及如何使用向量資料庫。學習使用LLMs和工具構建代理。
高級（~ 3 個月） — 掌握應用程式構建後，學習使用 LLMOps 在生產環境中部署、優化和管理LLM支援的應用程式。瞭解如何微調預訓練模型，以高效、低成本地適應下游應用。

初級
了解基礎LLM知識 — — 基礎 LLM 知識、知道 ChatGPT 是如何運作。
如何編寫提示(prompt)提升 LLM 輸出品質。
瞭解如何使用 API 的資料，瞭解如何使用 JSON 數據。
學習調用閉源模型和開源LLM模型、函數調用、傳遞提示和解析回應。
學習從對話中管理上下文長度。
學習建立和自動化一系列操作 — 例如: Langchain、Llamaindex等。
使用 Gradio 或 Streamlit 進行 POC 或 Demo。
部署應用程式讓使用者訪問 — 在 HuggingFace Space 或 Streamlit 雲上進行基本部署。
多模態生成 — 使用 HuggingFace transformer 套件產生程式、圖像、音訊。

中級
瞭解 Embedding 和向量資料庫。
瞭解如何將向量資料庫用於應用程式內。
構建檢索增強生成（RAG） — 可以與知識庫聊天。
進階RAG，例如子問題查詢，該搜尋可以在搜尋多個資料源後提供回應。
建構 Agent，用於完成一項大任務的反覆運算工作流。
構建多個 Agent，以提供更好的解決方案。
使用多個 Agent 實現自動化 — Autogen 和 Crew AI
評估RAG — RAGA 框架。
管理資料庫、檢索、部署完整的應用程式、版本控制、日誌記錄和監控模型行為。

高級
LLMs針對特定領域的知識和量身定製的回應（如醫學研究、金融研究、法律分析）進行微調。
整理數據集並設計（ETL pipelining）以進行模型微調。
評估和基準測試模型性能
LLMOps — 構建具有模型註冊表、可觀測性和自動化測試的完整端到端的管道。
構建多模態應用程式 — 使用文字和圖像進行混合語義搜索
構建 SDK、包和自訂解決方案，以支援其他開發人員
使用提示駭客攻擊等技術保護您的 AI 應用程式，並通過檢查漏洞和潛在風險來採取防禦措施。

參考資料: https://github.com/dswh/ai-engineer-roadmap

AI (Generative AI) Engineer Roadmap

Written by Cheng Lin Tsai