工作職責
1.建立并優化數據處理流程,為模型開發準備所需數據。
2.將多模態大型模型的開發環境構建為 Docker 容器和/或 Python 虛擬環境,并安裝所需的系統及 Python 軟件包
3.調整多模態大型模型的架構、損失函數及訓練策略,以滿足目標應用對模型的需求。
4.訓練或微調多模態大型模型,監控訓練過程,并根據關鍵性能指標調整訓練超參數。
5.利用現成的模型評估工具對模型性能進行評測,分析評估結果,并確定后續改進方案。
6.對模型進行剪枝和量化,在保證模型準確率的前提下降低內存占用并提升模型吞吐量。
7.使用主流模型部署工具在生產環境中部署模型。
崗位要求
1.擁有碩士學位及2年以上相關工作經驗,或具有博士學位。
2.熟悉 Transformers、PyTorch、Python、Bash、Docker 及 Git 等工具。
3.具備開發大型語言模型及多模態大型語言模型(例如視覺語言模型)的實戰經驗。
4.熟悉視覺語言模型、大規模推理模型、強化學習及 AI 智能體的最新進展。
5.精通提示工程,擅長設計針對大型語言模型及多模態大型模型的提示。
6.具備優秀的問題解決能力及溝通能力。