職位描述
崗位職責:1、負責類GPT通用大模型Post-training,包括但不限于強化學習,獎勵模型,數據合成,模型評測等工作相關方向的前沿探索和應用創新2、負責類o1復雜推理大模型Post-training相關工作,包括但不限于數據合成(MCTS等),強化學習,推理策略,模型評測工作相關方向的前沿探索和應用創新3、負責研究成果總結與輸出,包括發表高水平國際期刊/會議論文、撰寫專著、申請國家發明專利/軟件著作權、參加國內外重要科技競賽、組織國內外學術活動等; 崗位要求:1、本科及以上學歷,計算機科學與技術、人工智能、計算機、機器學習、大數據、數學等相關專業。博士學歷優先,有國際高水平院校教職/博后/留學經歷者優先,有國際知名產業機構工作經歷者優先; 2、在人工智能領域國際期刊/會議上以第1作者發表過論文≥2篇,在國內外重要科技競賽中以第1作者取得前3名成績者優先;有大模型領域知名博客,論文或開源項目者優先3、熟悉Pytorch, Transformers, Megatron-LM等主流深度學習或大模型訓練框架至少1種,有良好的大模型、生成式人工智能、機器學習等專業領域的學科知識基礎; 4、具備良好的主觀能動性,能主動思考、主動作為、主動反饋,有科研項目過程(申報/節點/結題/報獎)材料經驗者優先,有科研項目/產品轉化經驗和帶團隊經驗者優先。
企業介紹
中國電信人工智能研究院(TeleAI)由人工智能科學家、中國電信集團CTO及首席科學家李學龍教授牽頭組建,面向國家戰略需求和人工智能發展趨勢,結合中國電信在算力、數據、應用場景及5G/6G通信等多方面的優勢,圍繞大模型、具身智能、AIGC、AI平臺設施等方向開展基礎研究、技術攻關和應用落地。