崗位職責
1. 負責大型語言模型(LLM)和多模態大模型(MLLM)的研究與開發,包括模型預訓練、理論創新、性能評估與優化;
2. 大模型訓練數據構建, 訓練策略迭代和調優,推動大模型涌現能力的實現與提升;
3. 參與大模型的對齊技術研究與優化,聚焦于解決模型在復雜指令遵循、推理、幻覺、工具使用等問題中的表現瓶頸,提升模型的實用性與可靠性;
4. 負責大型語言模型的微調、偏好對齊、知識增強等技術探索,積極跟進AIGC業內應用趨勢,包括并不限于MoE、RLHF、Long context、RAG、Agent等方向;
5. 優化算法性能,提升系統在復雜場景下的魯棒性與高效性;
6. 跟進前沿技術(如多模態大模型、推理模型、CoT、diffusion和flow matching等),推動技術落地;
7. 與軟硬件團隊協作,完成算法模塊的工程化部署與測試。
任職要求 :
1. 計算機科學、人工智能、機器人學、數學等相關專業碩士及以上學歷;
2.具有扎實的編程功底和 DL/ML 基礎,熟悉LLM,MLLM大模型等訓練和推理;
3. 精通至少一種主流深度學習框(PyTorch/TensorFlow),熟練使用C++/Python編程;
4. 具有自然語言處理、計算機視覺、 模型壓縮和推理優化等領域的實際項目經驗;
5. 較強的論文復現能力或算法創新能力,能快速實現并優化前沿技術方案;
6. 良好的團隊協作與溝通能力,對技術落地有強烈熱情。