- 百日突破:階躍星辰大模型家族亮相,性能直逼GPT-4
- 2024年07月06日 來源:北方企業新聞網
提要:在人工智能的快速發展中,100天足以見證技術的巨大飛躍。AI效率工具“躍問”展示了100天的潛力:掌握一門新語言、學習編程、樂器演奏,或是繪畫、攝影等技能。而其背后的創造者“階躍星辰”,在這100天內,從萬億參數規模和多模態能力出發,推出了其大模型“全家桶”系列,標志著在應用落地方面邁出了重要步伐。
在2024年世界人工智能大會(WAIC 2024)上,首次參展的階躍星辰發布了萬億級參數的MoE(混合專家)大語言模型Step-2正式版,以及Step-1.5V多模態大模型和Step-1X圖像生成大模型。這些模型不僅展示了技術能力,還在WAIC 2024期間與上影合作,首次展示了AI大模型的應用落地效果。
在人工智能的快速發展中,100天足以見證技術的巨大飛躍。AI效率工具“躍問”展示了100天的潛力:掌握一門新語言、學習編程、樂器演奏,或是繪畫、攝影等技能。而其背后的創造者“階躍星辰”,在這100天內,從萬億參數規模和多模態能力出發,推出了其大模型“全家桶”系列,標志著在應用落地方面邁出了重要步伐。

階躍星辰的創始人兼CEO姜大昕認為,多模態理解和生成的統一是實現AGI(通用人工智能)的關鍵路徑。他強調,模型參數量是決定模型能力上限的關鍵,而萬億參數的Scaling Law是實現AGI的核心。通用大模型的能力也為垂直領域大模型設定了上限。
隨著AI技術的新一輪革新,階躍星辰正利用其大模型技術和應用,推動中國在全球AI領域的持續領先。
自20世紀50年代圖靈提出AI概念以來,AI領域經歷了多次技術迭代。從符號主義到聯結主義,再到深度學習的崛起,每一步都為AI注入了新活力。2022年底,ChatGPT的出現標志著AI新紀元的開啟,也展示了生成式AI產業的成長軌跡。
2024年3月,成立不久的階躍星辰首次公開亮相,帶來了Step-1千億參數語言大模型和Step-1V千億參數多模態大模型,引起了廣泛關注。公司以實現AGI為目標,專注于通用大模型的研發,并基于此打造了新一代的“AI+”應用。
在短短100天后,階躍星辰再次發力,推出了萬億參數規模的大語言模型Step-2正式版。Step-2采用MoE混合專家模型架構,在多個領域的表現直逼GPT-4。公司選擇了從頭開始訓練MoE模型的高難度路徑,以獲得更高的模型上限。
階躍星辰的Step-2在訓練過程中,團隊突破了多項關鍵技術,包括6D并行、極致顯存管理和完全自動化運維。同時,Step-1.5V多模態大模型在多模理解和生成統一的技術路線上取得了快速突破,Step-1X圖像生成大模型則支持全鏈路自研的DiT模型架構。
此外,階躍星辰的Step系列通用大模型因其技術創新和廣泛的落地應用實力,榮獲WAIC 2024 SAIL之星。
階躍星辰不僅在大模型技術和方案上提供強大能力,其應用落地也在不斷擴展。AI作為新生產工具,已在多個領域得到廣泛應用,推動了傳統行業的轉型升級。
今年3月,階躍星辰推出了兩款面向消費端的自研大模型產品——效率工具躍問和AI開放世界平臺冒泡鴨,均已全面開放使用。躍問提供多樣化服務,結合聯網搜索和代碼分析增強能力,有效理解和回應用戶查詢。冒泡鴨則為用戶提供了一個沉浸式的故事創作和角色探索平臺。

在WAIC期間,階躍星辰聯合上影推出了AI互動體驗,將AIGC和大模型技術與《大鬧天宮》情境深度融合,展現了中國傳統文化的魅力。
階躍星辰還在內容創作、金融財經等領域與合作伙伴進行深度合作,探索面向C端用戶的創新應用,并推出了開放平臺“繁星計劃”,加速AI在行業場景的應用落地。
憑借自研的萬億大模型技術實力,階躍星辰正推動中國AI產業的發展,形成了豐富的產業應用生態圈,并在重點行業實現了領先落地,成為中國大模型創業公司的第一梯隊。