中國阿里巴巴旗下的雲端運算服務科技公司阿里雲,週三(1月29日)農曆大年初一發布最新「通義千問」旗艦版人工智慧(AI)模型「Qwen2.5-Max」,號稱表現優於最近爆紅全球的深度求索(DeepSeek)推出的「DeepSeek-V3」模型。
綜合媒體報導,阿里雲在官方微信公告中表示,「通義千問 2.5-Max 幾乎在所有測試中表現優於 GPT-4o、DeepSeek-V3 及 Llama-3.1-405B」。其中,GPT-4o 和 Llama-3.1-405B 分別是 OpenAI 和 Meta 最新的開源AI模型。
據了解,Qwen 2.5-Max使用超過 20 兆token(AI模型處理的資料單位)的預訓練資料及精心設計的後訓練方案進行訓練。阿里雲表示,用戶不必進行繁瑣的文檔分割,該模型可記住更長的對話歷史紀錄,實現更連貫、更自然的交互體驗,也可更佳理解代碼、複雜推理、多輪對話等。