圖/本報資料庫
Hunter Alpha
2 hours ago

#Hunter Alpha
#DeepSeek
#AI模型
#人工智慧
#科技發展
圖/本報資料庫
圖/本報資料庫
商傳媒|何映辰/台北報導
摘要

一款名為「Hunter Alpha」的神秘AI模型於3月11日現身OpenRouter平台,其擁有1兆參數與100萬token上下文視窗,且可免費取用,引發開發者廣泛關注。儘管缺乏官方開發者資訊,但因其訓練資料截止點、推理模式及技術規格與中國AI公司DeepSeek預計4月發表的DeepSeek V4高度相似,外界推測Hunter Alpha可能是DeepSeek V4的早期測試版。部分專家持保留意見,但此現象凸顯AI業界透過匿名模型測試獲取回饋的趨勢,以及高性能免費模型對開發社群的吸引力。

一款名為「Hunter Alpha」的匿名人工智慧(AI)模型於3月11日在AI閘道平台OpenRouter上現身,因其強大功能卻無明確開發者資訊,在科技界引發熱烈討論。該平台隨後將其描述為一款「匿蹤模型」(stealth model),許多開發者推測它可能與中國AI公司DeepSeek即將推出的下一代模型DeepSeek V4有關。

根據《Deccan Chronicle》報導,Hunter Alpha是一款免費模型,並聲稱自己是「一款主要以中文訓練的中國AI模型」,其訓練資料截止至2025年5月。巧合的是,此知識截止點與DeepSeek自家聊天機器人所回報的相同。然而,當被問及創作者身分時,該系統拒絕透露,僅表示「我只知道我的名字、參數規模和上下文視窗長度」。目前DeepSeek與OpenRouter皆未對此模型做出官方評論,也未回應相關詢問。

Hunter Alpha的技術規格令人矚目。其簡介頁面指出,這是一款擁有1兆個參數的模型,這意味著它在處理語言和生成回應時,使用了約1兆個可調整的數值進行訓練。通常,參數越多的模型,運算能力需求也越高。此外,該模型聲稱具備高達100萬個token的上下文視窗(context window),這衡量了AI模型在單次互動中能夠處理或記憶的文本量。工程師納比爾·豪阿姆(Nabil Haouam)表示:「Hunter Alpha結合100萬token上下文、強大推理能力及免費開放,這一點非常突出。大多數具備如此大上下文視窗的前沿模型,在規模化應用時通常成本不菲。」

這些技術規格與中國媒體對DeepSeek下一代V4模型的預期高度吻合,該模型預計最快於4月發表。DeepSeek與許多中國競爭對手一樣,資金充裕,且其母公司是一家量化避險基金而非傳統科技巨頭,其組織架構顯得有些獨特。

儘管沒有直接證據,但這種高度相似性加劇了開發者們的猜測,認為Hunter Alpha可能是DeepSeek即將發表的V4模型的早期測試版本。AI工程師丹尼爾·迪赫斯特(Daniel Dewhurst)在分析該模型後指出,「思維鏈(chain-of-thought)模式可能是最強烈的訊號」,他解釋稱AI模型的推理風格很難偽裝,通常能反映其訓練方式。他補充說,Hunter Alpha的規模和記憶體容量也與今年初以來流傳的DeepSeek V4規格相符。

然而,也有部分開發者對於這種連結持謹慎態度。獨立AI基準測試專家烏穆爾·奧茲庫爾(Umur Ozkul)表示,他的分析顯示Hunter Alpha「可能並非DeepSeek V4」,理由是其token相關行為和架構模式與DeepSeek現有系統存在差異。但他承認,考慮到發表時機和所宣傳的能力,將該模型與DeepSeek聯繫起來的推測是可以理解的。

匿名模型發布在業界並非罕見。OpenRouter等平台允許開發者透過單一介面向多個AI模型發送查詢,使其成為新系統的熱門測試場域。例如,今年2月,一款名為Pony Alpha的匿名模型在OpenRouter上現蹤,五天後中國公司智譜AI(Zhipu AI)證實它是其GLM-5系統的一部分。Hunter Alpha的簡介頁面也提及,所有提示與完成資訊將由提供者記錄,並可能用於改進模型,這凸顯了業界透過匿名發布來獲取無偏見回饋的普遍做法。

截至上週日(3月15日),Hunter Alpha在平台現身後已被迅速採用,已處理超過1,600億個token。其中大部分活動來自軟體開發工具和AI代理框架,例如OpenClaw,這些框架允許AI系統自主規劃任務並與外部軟體互動。這也反映出AI開發社群對這類高性能且易於取用的模型的強烈需求。