Meta GEM 推薦基石模型深剖:大廠限定的工程地獄與落地取捨

Meta 最近揭露了其廣告推薦中央大腦 GEM(Generative Ads Recommendation Model) 的技術細節。公關數據非常漂亮:Instagram 廣告轉換率提升 5%,Facebook Feed 提升 3%,訓練效率是傳統蒸餾的 2 倍。

但站在做落地判斷的工程師視角,這是一篇典型的「大廠資源秀肌肉」報告。它堆砌了萬卡 GPU、自研 NCCLX 通訊與 Jagged Tensor 算子。以下我們直接扒開架構,評估其真正的工程代價與落地可行性。

一、 架構設計:解決稀疏性,但代價是推理延遲(Inference Latency)

推薦系統的核心痛點在於特徵空間極度稀疏(Sparse)與行為序列長度不一。GEM 採用了三個關鍵架構來應對: