股癌 EP527 筆記 2025/01/29

2025-01-30 findsther

股癌 527 筆記 「Deep Seek 展現降低 AI 模型訓練成本的可行性,挑戰硬體高資本支出模式。認為方向會是市場短期仍需求旺盛,但硬體估值恐下修,軟體板塊則因成本壓低而加速成長。提醒市場經常錯估,應專注開源技術對成本與滲透率的影響,目前操作方向調整配置至軟體應用,避開單日行情的情緒干擾。」

#個人整理一定會有不完整或理解錯誤,請以Podcast的內容為主。

股癌 EP527 筆記 2025/01/29


A. 市場對 Deep Seek 事件的解讀與迷思

  • 市場不會永遠正確
      主持人強調,市場常有錯誤定價。投資人若只以短期漲跌解釋一切,容易忽略市場的週期性與波動特質。漲就說利多,跌就說假突破,最終只會反覆「打臉」自己。
  • Deep Seek 的脈絡
      主持人在 1-2 個月前提及 Deep Seek 可能成為 AI 圈重大利空,並非為了「收割」或炫耀看對,而是想提醒投資人:現在討論已白熱化,代表利空已被廣泛關注,下一步應思考未來機會,而非沈溺在既定話題。
  • 雜訊充斥與投資重點
      網路上有大量情緒化發言,有些人想踩中國,有些人盲目捧中國。對投資來說,需聚焦「成本破壞力」與「市場結構」的改變,而不是被政治與口水戰牽著走。市場關注的重點在於:未來如何在波動中抓住被低估的機會,而非只解讀已發生的漲跌。

B. Deep Seek 模型的技術與成本探討

  • 訓練成本爭議
      Deep Seek 官方宣稱 600 萬美元完成訓練,外界認為若用 5 萬顆 H100,成本應遠超過此數。但主持人指出,模型訓練成本應以「伺服器租用」時數計算,而非直接將硬體整體購買金額平攤到單一模型。大廠購買的 GPU,也不只會訓練這一個模型。
  • 開源價值與平台審查
      Deep Seek 是開源模型,任何人可下載後自行調教。官方網頁端有政治審查,不代表模型能力受限;許多大型模型(OpenAI、Gemini)也在自家平台禁止敏感問答。開源的重點在於「他人可複製、改造」,而非政治立場。
  • 技術創新的真正意義
      關鍵並非「中國超越美國」,而是 Deep Seek 透過多專家(MOE)技術路線展現「以更少資源達成類似效能」的可能。即使其基礎源自其他模型,如 Llama,此乃開源常態:站在前人成果上迭代。重點在證明「低成本也能訓練高效 AI」,若這技術被廣泛驗證,勢必衝擊目前高資本支出的模式。

C. AI 產業發展趨勢與市場影響

  • 硬體 vs. 軟體估值轉變
      現階段市場仍需大量 GPU、伺服器支撐 AI 訓練,但若開源技術壓低成本,供應鏈的 EPS 未必下修,卻可能遭遇 P/E(估值)下滑。投資人可能不再給予「30~50 倍」的高乘數,而是回歸理性區間,說不定會到15~20倍。
  • 軟體全面噴發
      軟體企業(如 Cloudflare、Salesforce、Confluent)近來普遍股價表現強勁,反映市場預期「訓練成本下降→AI 應用普及加速」。原本預計 2026 才能看見的業績貢獻,可能提前至 2025 年。
  • 開源加速價格競爭
      OpenAI、其他開源團隊都在降 Token 費與算力租用價格,加劇市場競爭。模型部署門檻降低意味更多團隊會進場,整體需求上升雖能推升 GPU 銷量,但硬體廠商利潤空間可能受到壓縮,形塑「量增但毛利率壓力大」的新常態。
  • 泡沫風險
      若軟體公司在訓練成本降低後仍難見爆發性成長,說明市場過度炒作 AI 概念,可能存在泡沫。一旦資金退潮,無實質業績支撐的公司將面臨估值大幅收斂。

D. 投資策略轉變與機會

  • 市場論述改變
      過去強調 AI 硬體供應短缺、晶片獨大,現在聚焦開源技術對硬體高估值的動搖。雖然 EPS 短期無虞,但想像空間收斂後,市場對硬體給予的乘數可能走低。
  • 軟體布局與時間差
      訓練成本下滑後,軟體應用與服務(SaaS、平台、垂直解決方案)若能快速導入 AI 功能,將最先獲利。若廣大企業在 1-2 年內接受度提升,軟體公司可望迎來新一波成長周期。
  • 組合調整
      主持人自去年年中開始減少硬體投資部位,現階段計劃加碼軟體端,認為市場的「re-rate」已開始。硬體廠商可能會「derate」,而應用軟體反而趁此登上舞台,吸引資金流入。
  • 核心思維
      Deep Seek 代表成本破壞力的到來:開源技術持續發展,推動整體 AI 門檻下修,吸引更多競爭者。投資人須留意:若軟體也無法乘勢擴張,則顯示市場對 AI 的期待可能有泡沫成分。

#個人想法

過去的經驗,孟恭大有提到新的想法時,反應會在2~5個月的期間,如果只看短期沒有跟著做調整,雖然還能賺到原本的漲幅,但是如果反應時有機會把原本的漲幅給回吐,所以不要想著都吃到所有的漲幅,還是需要做調整,才能平衡。

DeepSeek 待續推出新的模型,這幾天是發布Janus-Pro圖像生成模型,雖然OpenAI是說有盜用其模型進行開發,還有大量輝達H100高階晶片,這應該可以報很久。但是開發還是會待續下去,如孟恭大說的說不會一般時間Meta也開始推這一類的模型出來,那是不是之後要看的是如何能在最短時間生出企業適合使用的模型,而且精度要夠,那就是最大受益者?但是思考的速度要快應該還是需要硬體的效能才對吧?

如果目前要轉去軟體股,那台股的軟體股?,台灣沒有自已開發出模型的能力?目前知道的是有行政院提出的TAIDE,還有2024年中時正崴集團之前宣布亞洲算力最大的人工智慧(AI)綠能運算中心,並由正崴、優必達與森崴能源,合資成立友崴超級運算公司。