IT之家 1 月 8 日消息,據 AI 科(kē)技(jì )評論消息,前微軟亞洲研究院視覺計算組首席研究員胡瀚,不久前加入騰訊,接替已離職的前騰訊混元大模型技(jì )術負責人之一的劉威,負責多(duō)模态大模型的研發工(gōng)作(zuò)。去年 11 月,有(yǒu)消息稱騰訊傑出科(kē)學(xué)家、騰訊混元大模型技(jì )術負責人之一劉威已從騰訊離職。
胡瀚于2008年獲得清華大學(xué)本科(kē)學(xué)位,2014年獲得清華大學(xué)博士學(xué)位。2016年12月,胡瀚加入微軟亞洲研究院視覺計算組。
報道稱胡瀚是計算機視覺領域的重要研究者,他(tā)曾以核心作(zuò)者身份參與論文(wén)《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》的創作(zuò)。
Swin Transformer性能(néng)優于DeiT、ViT和EfficientNet等主幹網絡,已經替代經典的CNN架構,成為(wèi)了計算機視覺領域通用(yòng)的backbone(IT之家注:backbone 是指一種在神經網絡或機器學(xué)習模型中(zhōng)常用(yòng)的基本結構或骨架)。
去年9月,騰訊正式發布新(xīn)一代大模型 —— 騰訊混元 Turbo。據騰訊官方介紹,該模型采用(yòng)MoE架構,比上一代産(chǎn)品推理(lǐ)效率提升100%,推理(lǐ)成本降低50%。
去年12月,騰訊宣布混元大模型上線(xiàn)并開源文(wén)生視頻能(néng)力,參數量130億,支持中(zhōng)英文(wén)雙語輸入。