阿里巴巴發布最新AI模型聲稱超越DeepSeek

中國阿里巴巴旗下的雲端運算服務科技公司阿里雲，週三（1月29日）農曆大年初一發布最新「通義千問」旗艦版人工智慧（AI）模型「Qwen2.5-Max」，號稱表現優於最近爆紅全球的深度求索（DeepSeek）推出的「DeepSeek-V3」模型。

綜合媒體報導，阿里雲在官方微信公告中表示，「通義千問 2.5-Max 幾乎在所有測試中表現優於 GPT-4o、DeepSeek-V3 及 Llama-3.1-405B」。其中，GPT-4o 和 Llama-3.1-405B 分別是 OpenAI 和 Meta 最新的開源AI模型。

據了解，Qwen 2.5-Max使用超過 20 兆token（AI模型處理的資料單位）的預訓練資料及精心設計的後訓練方案進行訓練。阿里雲表示，用戶不必進行繁瑣的文檔分割，該模型可記住更長的對話歷史紀錄，實現更連貫、更自然的交互體驗，也可更佳理解代碼、複雜推理、多輪對話等。

在 Instagram 查看这篇帖子
Landpower Real Estate Ltd. (@landpowerrealestate) 分享的帖子

阿里巴巴發布最新AI模型 聲稱超越DeepSeek