EP2: Higgsfield — レシピ版
9ヶ月で$230M ARR。モデルを持たないユニコーン。Snap出身の「モデルを作る側」にいた男が、あえて「作らない」と決めた。競合はOpenAIでもAdobeでもなく、TikTok。裸で分析する。
リサーチ参照: references/Higgsfield_Market_Research_2026.md
構成(30-45分想定)
OPENING(2-3分)
仮説: EP1が「AIの上にビジネスを建てた」話なら、EP2は「AIの上にAIを載せた」話。このレイヤーの選択が、2つの企業の運命を分ける。
ファクト:
- 9ヶ月で$230M ARR達成(2026年1月、Sacra。TechCrunchは$200M)
- 評価額$1.3B(カザフスタン初のユニコーン)
- 動画生成AI市場でほぼ唯一の「モデル非保有」アグリゲーター戦略
- 競合(Runway $860M、Luma $1B+調達)は全て自社モデル開発に投資
- Mashrabov自身の競合認識:OpenAIでもAdobeでもなく、ByteDance(TikTok)
問い:
- なぜHiggsfieldだけが「作らない」戦略を選んだのか?
- EP1のEveryは「自分たちが使うものを作る」Skin in the Gameだった。Higgsfieldは「他人が作ったモデルを繋ぐ」— この違いは長期的に何を意味するか?
- 競合をTikTokと定義している — HFはAI企業ではなくソーシャルメディア企業?
話すポイント:
- EP1の振り返り(Agent-Native、Compound Engineering、コードを書かないエンジニア)
- 今回は「作る」ではなく「繋ぐ」戦略の分析
- 「レイヤーの選択」 — EveryはAIの上にビジネスを建てた、HFはAIの上にAIを載せた
PART 1: Higgsfieldとは何者か(8-10分)
仮説: Alex Mashrabovは「最高のアルゴリズムより、魔法を即座にスケールで届けること」こそが価値だと知っていた。ソ連の宇宙プログラムでロケットを設計した母を持つエンジニアが、あえてエンジニアリングを捨てた判断の意味。
ファクト(Alex Mashrabov — 人間像):
- カザフスタン・Andijan生まれ
- 両親ともにエンジニア。母親はソ連の宇宙プログラムでロケット設計を担当
- AI Factory共同創業 → 2020年にSnapが$166Mで買収(リアルタイム顔認識技術 → Cameos機能の基盤)
- Snap GenAI部門ディレクター就任、7年間CVチーム統括(ARフィルター、Cameos、MyAI)
- Forbes 30 under 30ノミネート
- 2023年10月にSnapを離れてHiggsfield創業
ファクト(Mashrabovの戦略的思考 — Sacraインタビューより):
- 核心的哲学:
"it's not about the fanciest algorithm; it's about delivering magic instantly, at scale"
- 「毎週"最高のモデル"を出す競争に意味がない」と明言
- 「ファウンデーションモデルを作る会社は勝たない」と断言
- 競合認識: OpenAIでもAdobeでもなく、ByteDance(TikTok) → AI企業ではなくソーシャルメディア企業として勝負
- 社名の由来: ヒッグス場(素粒子に質量を与える力)→「アイデアに質量を与えるプラットフォーム」
- 「Adobeは危機にある」「トップ広告主は年間10,000+のad creativesを生産する」
ファクト(チーム — 3人の組み合わせの意味):
- Alex Mashrabov(CEO)— 技術 + AI Factory買収経験
- Yerzat Dulat(CTO)— トップAI研究者、人気OSS著者
- Mahi de Silva(CSO)— Apple(エンジニア)→ VeriSign(VP→GM)→ AdMarvel創業(Operaに買収、1ヶ月で収益10倍化)→ Amplify.ai創業(Trillerと合併、CEO就任)。スリランカ出身、Stanford。B2B戦略の設計者
"Higgsfield is building a new creative operating system that can serve Fortune 500 companies"
- チーム: 約60名(2025年)→ 2026年末300名予定。元Snap、OpenAI、DeepMind出身者
ファクト(沿革 — PMFの3段階進化):
| 年月 | 出来事 | Phase |
|---|---|---|
| 2023年10月 | 創業 | — |
| 2024年1月 | Seed $8.16M(Menlo Venturesリード) | — |
| 2024年4月 | 公式ローンチ(APIベース) | Phase 1: クリエイター向け実験ツール |
| 2024年6月頃 | 200万MAU、60万DAU | Phase 1 |
| 2024年8月 | Diffuse 2.0 | Phase 1 |
| 2025年3月 | ブラウザプラットフォームローンチ | ★Phase 2開始: 最大の転換点 |
| 2025年5月 | $11M ARR | Phase 2: マーケター向けプラットフォーム |
| 2025年9月 | Series A $50M、$1B評価、カザフスタン初のユニコーン | Phase 2→3 |
| 2025年11月 | $100M ARR(5月から9倍) | Phase 3: エンタープライズインフラ |
| 2026年1月 | Series A Ext. $80M(Accelリード)、$1.3B、$230M ARR | Phase 3 |
ファクト($11M→$230Mで何が起きたか — 成長の5大ドライバー):
-
ブラウザプラットフォーム(2025年3月) ← 最大のトリガー
- API限定 → エンドツーエンドのワークフロー実現(Canvas/プリセット/エクスポート全てブラウザ内完結)
- 非技術者(マーケター)が使えるように → ここから$11M→$100M(9倍)
-
セレブ採用 + バイラルコンテンツ
- Madonna、Will Smith、Snoop Doggが初期採用者
- "Epstein Island Vacation"動画がXで100万RT超 → 認知度爆発(★未検証、36kr記載)
-
クリエイター・インセンティブ
- 週次ボーナス最大$100,000 + 15%コミッション(最大12ヶ月)のアンバサダープログラム
-
エンタープライズ高ARPU化(2025年9月〜)
- Ads 2.0、Soul UGC Builder、UGC Factory、Vibe Motion
- Fortune 500向け高額契約 → $100M→$230M(2ヶ月で2.3倍)の主因
-
市場の追い風 — AI動画市場CAGR 20-32%に対しHFは約56倍速(CMGR 60%)
ファクト(プロダクト:Diffuse — ★実際に使って補強すること):
- iOS/Android + ブラウザ
- コア: "Click-to-Video"
- 統合モデル: Sora 2、Veo 3.1、Kling 2.6、WAN 2.5、Seedance、MiniMax等
- モデル選択はユーザーの手動(自動ルーティング未実装)
- 自社モデル: DoP(実態はプリセット/フィルターシステム)、Soul AI(ハイパーリアリスティック、「カメラライクな不完全性」再現)
- Speak 2.0: プロンプトのみで音声生成、WAN 2.5ネイティブオーディオ
- 料金: Free / Basic $9 / Pro $29 / Ultimate $49 / Creator $149 / Custom
- 生成速度: 30〜90秒、1日450万本
- Adobe Premiere Pro / After Effectsネイティブ連携なし
- Trustpilot: 3.2/5(576件)— 5つ星47% vs 1つ星40%の二極化
問い:
- ロケット設計者の母を持つエンジニアが「最高のアルゴリズムではない」と言う — これはSnapの7年間で何を見たから言えるのか?
- 「ファウンデーションモデルを作る会社は勝たない」— なぜ? 市場のほぼ全社が逆の判断をしているのに
- 競合=TikTokという定義 — HFは本当にソーシャルメディア企業として勝負しているのか?
- ブラウザローンチが最大の転換点 — なぜAPIからブラウザへの変更でこれほど爆発したか?
- セレブ採用は戦略的か偶発的か? 週次$100Kのクリエイターインセンティブの持続可能性は?
- Mahi de Silvaの経験(Opera買収後1ヶ月で収益10倍、Triller CEO)はどう活きているか?
- Trustpilot 3.2/5の二極化 — 何が起きている?(★収録前にレビュー読むこと)
話すポイント:
- Mashrabovの人間像(カザフスタン、ロケット設計者の母、AI Factory $166M、Snap、独立)
- 「作る側にいたからこそ作らないと決めた」逆説 + 核心哲学「magic instantly, at scale」
- 3人の共同創業者の組み合わせの意味(技術 × 研究 × GTM/B2B)
- PMF 3段階進化(ツール→プラットフォーム→インフラ)とブラウザ化の転換点
- 成長5大ドライバーと市場56倍速の異常さ
- ★実際に使ってみた体験(収録前宿題)
PART 2: Higgsfield vs Midjourney — モデルを握るか、その上に乗るか(8-10分)
仮説: 「モデルを作る vs 作らない」は技術論ではなく「誰に売るか」で決まる。しかし本質的には、MidjourneyはクリエイターのIDを作っているのに対し、Higgsfieldはマーケターの武器を売っている。道具にはアイデンティティが宿る。武器は乗り換えられる。
ファクト(Midjourney: バーティカルインテグレーション):
- 完全自社モデル開発(V1→V7、Niji 7まで自社で進化)
- VCゼロ、完全自己資金で$500-600M ARR(2026年予測)
- Discord 2,100万会員(世界最大のDiscordサーバー)→ 30%以上がWeb版「Omni Reference」経由に移行
- Discordを核にした初の$200M ARR企業(前例なし)
- カスタムモデル機能: ユーザーが独自の美学に特化したモデルを複数作成可能
- 「ランキング」システム: ユーザーが画像ペアを評価→モデルが好みを学習
- David Holzの哲学:「VCに頼らず、ユーザーの金で研究開発する」
ファクト(Higgsfield: オーケストレーション・レイヤー戦略):
- 統合モデル: Sora 2、Veo 3.1、Kling 2.6、WAN 2.5、Seedance、MiniMax、FLUX.2等
- 自社モデルは補完的: DoP(プリセットシステム)、Soul AI(「カメラ不完全性」再現)
- GMI Cloud: レイテンシ65%削減、スループット3倍(マネージドK8s + H100 GPU)
- $30で$10,000相当の動画制作(★自社主張、独立検証なし)
対比表:
| 軸 | Midjourney | Higgsfield |
|---|---|---|
| モデル | 完全自社開発 | アグリゲーター(複数モデル統合) |
| 資金 | VCゼロ | $138M調達(VC依存) |
| ユーザー | 多様なクリエイター | マーケター中心(Ads 2.0等のプロダクト設計から推定) |
| 収益モデル | サブスク($10-120/月) | クレジット制(従量課金) |
| 差別化 | 独自美学・パーソナライゼーション | 速度・コスト・柔軟性 |
| 競合認識 | 他の画像生成AI | TikTok(ByteDance) |
| 成長 | 3年で$500-600M ARR | 9ヶ月で$230M ARR |
ファクト(品質収束 — モデル間の差は縮まっている):
- Artificial Analysis Elo(2026年2月): Runway Gen-4.5 = 1,247(1位)vs Veo 3.1(2位) — 差はわずか21ポイント(直接比較でRunway勝率 約53%)
- Wan 2.2(オープンソース): 15億動画+100億画像で訓練、商用SOTAと競合
- 業界コンセンサス: 「AI動画品質はもはや競争的モートではない」
- 競争軸が「何を作れるか(What)」→「どう指示するか(How)」にシフト
問い:
- MidjourneyがVCゼロで$500-600M ARRを達成できた理由は?
- マーケターは道具を乗り換える。次により良いツールが出たら何が残る?→ しかしMashrabovは違う土俵(TikTok)で戦おうとしている
- 品質収束が進んでいるなら、HFの「モデルはコモディティ化する」前提は正しいかもしれない?
- Elo差21ポイント — これはモデル差別化の終わりの始まりか?
話すポイント:
- MJ vs HFの成長戦略の根本的な違い
- 品質収束のデータ(Elo 21ポイント差)→ モデルのコモディティ化は既に始まっている?
- 「クリエイターの道具」vs「マーケターの武器」— 道具にはIDが宿る、武器は乗り換えられる
- しかしMashrabovは競合をTikTokと定義 = そもそも違うゲームをしている
PART 3: 「アグリゲーター」の幻想 — HFは何者になれるのか(8-10分)
仮説: Higgsfieldは「アグリゲーター」ではなく「リセラー」に近い。ただし、最強の反論(スチールマン)も検証した上で判断する。
ファクト(Ben Thompson Aggregation Theory 1.0 — Stratechery, 2015):
オリジナルATの3条件:
- 直接の顧客関係: ユーザーとの1対1関係を所有
- 供給側のコモディティ化: サプライヤーを交換可能にし、**「アグリゲーターなしでは顧客に届かない」**状態を作る
- 限界費用ゼロの流通: デジタル流通で追加コストなし
- Google: Webサイトをコモディティ化 → サイト運営者はGoogleなしでトラフィックを得られない
- Amazon: 小売業者をコモディティ化 → 出店者はAmazonなしで顧客に届かない
- 核心: 供給側がアグリゲーターに依存する一方向の力関係
Higgsfieldの現状(AT 1.0で判定):
- 顧客関係: 1,500万ユーザー ✓
- 供給側コモディティ化: OpenAI、Google、Kuaishouをコモディティ化? ✗
- HFがOpenAIに依存(逆ではない)— OpenAIはHFなしで数十億ユーザーにリーチ可能
- OpenAI値上げ → HFマージン消失
AT 1.0の定義に照らすと、HiggsfieldはGoogleではなくBest Buy。顧客にはリーチしているが、サプライヤーに対して交渉力を持っていない。
ファクト(Aggregation Theory 2.0 — Tikue Anazodo, Medium 2025):
元Google/Affirm、Kudos共同創業者CEOによるATの拡張:
- AT 1.0の通貨 = 注意(Attention) → インターフェースを所有する者が勝つ
- AT 2.0の通貨 = 成果(Outcome) → **Intent(意図)× Context(文脈)× Action(行動)**を統合する者が勝つ
- AIがインターフェースそのものを置き換える → 「メニューを選ぶ」から「ゴールを委任する」へ
- 新しいモート = Context(ユーザーの行動・嗜好・制約の深い理解)
- 新しいボトルネック = 信頼(Trust) — 委任には透明性・一貫性・アラインメントが必須
- 勝者 = 一つの万能プラットフォームではなく、ドメイン特化の垂直プラットフォーム群
HFをAT 2.0で再解釈すると:
- 有利に見える面:
- 「動画マーケティングを作りたい」Intent × 「ブランドガイドライン・過去の好み」Context × 「最適モデルで自動生成」Action → 成果デリバリー型プラットフォームになれる可能性
- 450万本/日の生成データ = Contextのモートを構築できる素材がある
- マルチモデル統合 = ユーザーに代わって最適なActionを選ぶ能力(ただし自動ルーティング未実装)
- 「動画生成」ドメインの垂直特化エージェントとして勝てるシナリオはある
- しかしAT 2.0でも致命的な問題 — 信頼の自壊:
- AT 2.0で最も重要な通貨はTrust。成果を委任してもらうには一貫性と透明性が必要
- HFのユーザー構成: マーケター + クリエイター(プロダクトラインがAds 2.0、UGC Factory等マーケター向けに偏重)
- マーケター = 多くはサラリーマン → ブランドセーフティ・安定性・再現性を求める
- クリエイター = 自分の技術・作品への尊重、倫理的配慮を重視
- にもかかわらず、HFのキャンペーンとCSはこのユーザー層と真逆:
- "Epstein Island Vacation"バイラル(100万RT)→ サラリーマンマーケターが社内稟議で使えるブランドイメージか?
- セレブディープフェイク(Madonna、Will Smith)→ クリエイターのIP・倫理意識と衝突
- Trustpilot 3.2/5(5つ星47% vs 1つ星40%の二極化)→ CS品質の構造的問題を示唆
- クリエイター・インセンティブ(週次$100K)→ 金で釣るが、コミュニティの信頼は育てていない
- AT 2.0の言葉で整理すると: HFは「Attention」を最大化する1.0的キャンペーン(炎上バイラル、セレブ採用)で、2.0に必要なTrustを自ら毀損している
AT 1.0ではBest Buy(リセラー)。AT 2.0で再解釈すれば「動画生成ドメインの垂直エージェント」になれる理論的可能性はある。しかし2.0の通貨であるTrustを、1.0的な炎上マーケティングとCS品質の二極化で自ら削っている。ユーザーの大半がサラリーマンマーケターとクリエイターであるにもかかわらず、彼らが最も嫌うタイプのブランドを構築してしまっている。
ファクト(スチールマン — HFが真のアグリゲーターになれる可能性):
※ スチールマン(Steel Man): ストローマン(藁人形論法=相手の主張を弱く歪めて叩く)の逆。相手の主張を最も強い形に再構成した上で反論する手法。ここではHFに対して最も好意的な解釈を並べ、それでも成立するか検証する。
-
データ・アドバンテージ: 1,500万ユーザー × 450万本/日の生成データ → モデル提供者に対する交渉力の源泉になりうる
- 反論: OpenAI自身が数十億ユーザーのデータを持つ。1,500万人は相対的に小さい
-
UIロックイン: 70種プリセット+ワークフローに慣れる方がスイッチングコスト高い
- 反論: モデル選択が手動(自動ルーティング未実装)。Adobe/Canvaに比べUIの洗練度は?
-
後発的モデル開発: $230M ARRのキャッシュで後からモデル開発(Amazonプライベートブランド戦略)
- 反論: Runway $860M、Luma $1B+を投じている相手に追いつけるか? ただしNebius + HGX B200で自社拡散モデルのトレーニングは完了済み(後述)
-
品質収束の追い風: Elo差21ポイント → コモディティ化が進むほどHF戦略は強化
- 反論: 収束しているのは「ベースライン品質」。特化領域(人物、アニメ、シネマティック)ではまだ差
-
ネットワーク効果の萌芽: "Epstein Island"バイラル(100万RT)、セレブ採用
- 反論: バイラル動画は一過性。持続的ネットワーク効果とは言えない
ファクト(Chris Dixonパターン):
- 「Come for the tool, stay for the network」(cdixon.org、2015年1月31日)
- 成功例: Instagram(フィルター→共有)、Yelp(ディレクトリ→レビュー)
- 批判(TechCrunch 2016): 実際の成功例は驚くほど少ない
- 失敗例: Google Buzz、Apple Ping、Dropbox Carousel
- Instagram、Facebookは最初からネットワーク要素があった
- HFの問題: マーケター中心 → 効率重視、作品への愛着薄い
ファクト(Instagramのツール→ネットワーク転換 — HFへの適用):
Instagramのタイムライン:
| 時期 | フェーズ | 何が起きたか |
|---|---|---|
| 2010年10月 | ツール | ローンチ。フィルターで「スマホの貧弱なカメラ」を解決。初日25,000ユーザー |
| 2010-2011年 | ツール→ネットワーク | フィード・いいね・コメント・フォローがローンチ初日から存在。ツールとネットワークが同時に起動 |
| 2011年6月 | ネットワーク加速 | 500万ユーザー。Facebook/Twitter連携で既存ソーシャルグラフをインポート |
| 2012年4月 | ネットワーク確立 | 2,700万ユーザー。Facebookが$1Bで買収 |
Instagramの成功要因とHFへの適用:
- ツールがペインポイントを即座に解決: フィルターは「カメラが悪い」問題を1タップで解消 → HFの「Click-to-Ad」(2-5分で商品動画)は同等のペインポイント解決力を持つ
- ネットワーク要素がDay 1から存在: Instagramはフィルター「だけ」のツールだった期間がない → HFのFeed機能は後付け。ここが決定的に違う
- コンテンツが本質的に共有可能: 美しい写真は見せたくなる → マーケターの広告動画は「見せたい」ものか? 広告は共有されない。作品は共有される
- 既存ソーシャルグラフの活用: Facebook/Twitter連携 → HFにはインポートすべきグラフがない
HFがネットワーク転換するなら誰に何を提供すべきか(戦略立案):
- ターゲット: マーケターではなくクリエイター。マーケターは効率を買うがネットワークに留まらない
- ネットワークバリュー: 「テンプレート/スタイルの共有・リミックス」— DoPプリセットやSoul IDキャラクターを他ユーザーが再利用・派生できるエコシステム
- 参考モデル: Midjourney(審美的コミュニティ)> TikTok(消費型フィード)。HFが目指すべきは「AI動画クリエイターの美学が蓄積・交換される場」
- しかし現実: HFの収益ドライバーはAds 2.0/UGC Factory(マーケター向け)。クリエイター向けネットワーク投資はARR成長と矛盾する可能性
ファクト(AI生成SNSの教訓 — Civitai):
HFとCivitaiは性質が異なる(Civitai=SDカスタムモデル共有、HF=マーケター向け動画生成)が、「AI生成コンテンツSNS化」のリスクとして参考:
- ディープフェイク(90%が女性ターゲット)、NSFW過半数
- NSFW報告画像の88.4%が非NSFWモデルから生成(プロンプト悪用)
- 2025-2026年に決済プロセッサー圧力で規制強化
- 動画は画像よりモデレーション桁違いに困難
ファクト(モデル提供者が上に登ってくる):
- OpenAI、Anthropicがオーケストレーションレイヤーに進出中
- Sora 2: 2026年1月10日にFreeユーザー廃止 → API依存企業に直撃
- Runway: $860M調達してGen-4.5 + ワールドモデル開発
問い:
- HFはGoogleか、Best Buyか? AT 2.0で「垂直エージェント」と再解釈できるか?
- AT 2.0が正しいとしても、Trustを構築するキャンペーン・CSを行っているか? 炎上バイラルはAttention(1.0)であってTrust(2.0)ではない
- スチールマン5つのうち、最も説得力があるのはどれ? → 品質収束(Elo 21pt差)が最有力?
- マーケターが「空想世界のSNS」でつながりたいと思うか?
- Civitaiのモデレーション地獄をHFはどう回避するのか?
- OpenAIが直接B2C強化したら、HFに何が残る?
- EP1のEveryは「コードの終焉」で自分たちの価値を再定義した — HFは何で再定義できる?
話すポイント:
- AT 1.0 → HFへの適用 → リセラー判定(Best Buy)
- AT 2.0で再解釈 → Intent × Context × Actionの垂直エージェントになれる理論的可能性
- しかしAT 2.0の通貨はTrust → HFの炎上マーケ・CS二極化は1.0的Attention追求であり、Trustを自壊させている
- ユーザー層との矛盾: サラリーマンマーケター(ブランドセーフティ重視)とクリエイター(倫理・尊重重視)がコアユーザーなのに、Epstein動画やセレブディープフェイクで認知を稼ぐ
- しかしスチールマンも検証(データ、UIロックイン、後発モデル開発、品質収束、ネットワーク萌芽)
- 品質収束(Elo 21pt)がスチールマン最有力 → ただし特化領域ではまだ差
- Chris Dixon批判 + Civitai教訓(性質の違いは認めた上で)
- モデル提供者の「上への進出」
PART 3.5: HFの本当の勝ち筋 — 「アグリゲーター」でも「SNS」でもなく「垂直ワークフロー・プラットフォーム」(5-8分)
仮説: HFの勝ち筋は「アグリゲーター」でも「SNS化」でもない。ソーシャルメディア広告制作の垂直ワークフローを、担当者レベルで完全に構築する「プロセス・エンジニアリング」企業になることではないか。
具体的には:
- 大規模広告予算チームの「コスト削減」を売りにすると組織的反発を伴う(既存のクリエイティブチーム・制作会社の仕事を奪う)
- 代わりに、中小レベルで独自のメディアスタジオを持ちたい自社製品企業(D2Cブランド、EC事業者等)に「制作能力そのもの」を提供する
- または大手出版社・IPホルダーと提携し、彼らの自社クリエイティブスタジオ構築を支援する(HFが裏方のFull Deployment Environmentとして機能)
- Consumer向けには、Cinema Studioのような誠実なブランディングと、ユーザーFBによるコンテキスト調整の継続的改善に注力する
Mashrabov本人の発言による補強(Sacraインタビューより):
ワークフロー全体のオーケストレーション:
"We orchestrate the entire workflow. Our goal is to deliver the video and eventually deliver sales through videos."
→ 動画制作ツールではなく、「動画を通じた売上」までを射程に入れている。これはツール屋ではなくワークフロー・プラットフォームの発想
エンタープライズの実態:
"We're seeing customers with marketing budgets over $100 million who turn 90% of their ad creative to be generated with AI."
"Companies spending over $10 million in advertising on Meta launch over 10,000 new ad creatives yearly, requiring at least 40 videos a day."
→ 大企業は既に90%をAI化。問題は「コスト削減の提案」ではなく「40本/日の制作を回すワークフロー」の構築支援
クリエイターとの関係:
"We see tens of thousands of AI-first creators who make commercial marketing campaigns on the Higgsfield platform for many major brands."
"The only bottleneck for these AI-first creators is actually communication with the clients and defending and explaining their creative vision."
→ HFのユーザーには「AIファーストクリエイター」という新カテゴリが存在。彼らのボトルネックは技術ではなくクライアントコミュニケーション
プロダクション・タックスの除去:
"We completely removed the production tax so that the best idea and best story should win."
→ 制作コストを「税金」と定義し、それを除去することで「アイデアの質だけで勝負」できる世界を作る
フィードバックループ:
"We release six days a week—more than 300 times a year—we have this closed feedback loop so we learn quickly."
→ 週6リリース × 300回/年のクローズドFBループ。これはプロセス・エンジニアリングの核心
長期ビジョン:
"In 10 or 20 years, we see a company with billions of users, hundreds of millions of commercial videos, a thriving professional ecosystem, and billion-dollar revenues." — Yerzat Dulat (CTO)
"If we follow the trajectory, we can become a sustainable $100 billion company." — Mashrabov
George Sivulka「In defense of vertical software」(2026年2月)との接続:
Hebbia CEO Sivulkaの論旨:
- エンタープライズソフトウェアの価値はコードではなくプロセス・エンジニアリングにある
-
"Software is a stored process. It's not a neutral tool: it's an opinion for how a group of people should collaborate, encoded in a durable system. Software is a social contract."
- 「ラストマイル」= 特定のチームが特定の仕事をする方法の10%の差異。ここに差別化価値の全てがある
-
"The 10 percent is where deals get done and careers get made. That is where all the differentiated value resides."
- 汎用AIはこの10%に踏み込めない: Anthropic/OpenAIは全ユースケースに対応する必要があり、特定チームのワークフローに対してopinionatedになれない
- モートは「共有ツールが共有言語を生み、それが自己強化的ネットワーク効果になる」ことで生まれる
HFへの適用:
| Sivulkaの原則 | HFの現状 | HFが目指すべき方向 |
|---|---|---|
| プロセス・エンジニアリング | 「ワークフロー全体をオーケストレート」(Mashrabov) | 特定業種(EC、出版、IPホルダー)ごとの制作プロセスを深く理解・エンコード |
| ラストマイル(10%の差異) | Cinema Studio/DoPプリセットで一部対応 | ブランドガイドライン・過去の好み・承認フローを学習し、チームごとにカスタマイズ |
| ソフトウェア=社会契約 | まだツール段階(手動モデル選択) | 「このチームはこう作る」をエンコードした制作OS化 |
| 共有言語のネットワーク効果 | Feed機能は後付け、弱い | テンプレート/スタイルの共有・リミックス → 「HFで作る」が業界標準語になること |
この仮説が正しいなら、HFの戦略的優先順位は:
- アグリゲーター論争を降りる: モデルを持つ/持たないの議論は的外れ。勝負は「特定チームの制作プロセスをどれだけ深くエンコードできるか」
- 中小D2Cブランドの「自社メディアスタジオ化」を支援: 広告代理店を介さず40本/日を回せるワークフローを提供。Click-to-Ad(2-5分で商品動画)はこの方向の萌芽
- 大手出版社・IPホルダーとの提携: 彼らのIPを活用したクリエイティブスタジオのバックエンドとしてHFが機能。HF自身はブランドを前面に出さない
- Consumer向けは誠実なブランディング: Cinema Studio(プロ志向のネーミング)は好例。Epstein動画のような炎上バイラルと決別し、Trustの構築に転換
- クローズドFBループの強化: 300回/年のリリースサイクルで、ユーザーの学習データ・コンテキスト(ブランドガイドライン、過去の承認パターン等)を蓄積し、モデルの出力品質を継続改善
問い:
- Mashrabovは「deliver sales through videos」と言う — これはワークフロー・プラットフォームを超えてパフォーマンスマーケティング・プラットフォーム(広告効果の測定・最適化まで)を目指している?
- 大企業の「90%をAI化」は、既存クリエイティブチームの反発をどう乗り越えたのか? HFはこの政治的プロセスも支援しているのか?
- Sivulkaの「ラストマイル10%」をHFが押さえるには、業種特化が必要。現在の汎用プラットフォームからどう絞るか?
- IPホルダー提携は魅力的だが、IP利用のライセンス問題(Civitai教訓と同じ構造)をどう解決するか?
PART 4: 技術とビジネスの裏側(5-8分)
旧版の「競合マップ表の羅列」を廃止。AI起業家・研究者にとっての「発見」を優先。
仮説: HFの技術的な面白さは「モデル」ではなく「インフラとオーケストレーション」にある。
ファクト(マルチモデルアーキテクチャの実態):
- モデル選択は現時点で完全手動 — 自動ルーティング未実装
- ユーザーがセレクターで手動選択: Kling 2.6、Sora 2、DoP、WAN 2.5等
- 自動ルーティング未実装 = UX上の大きな改善余地(あるいは戦略的に手動?)
- LLMでプランニング・推論 → サードパーティ動画モデルと連携してビジュアル一貫性を維持
ファクト(OpenAI統合 — 「シネマティック・ロジックレイヤー」):
(出典: OpenAI公式 - Higgsfield)
- HFはOpenAIの3モデルをプランニング〜生成の全レイヤーで統合:
- GPT-4.1 mini: 構造化・決定論的ワークフロー(予測可能な出力、操作性重視のタスク)
- GPT-5: 複雑な推論・マルチモーダル解釈(曖昧なクリエイティブブリーフの意図理解)
- Sora 2: 動画レンダリング
- 「シネマティック・ロジックレイヤー」: ユーザーの意図(「ドラマチックにして」)をカメラ指示ではなく感情レベルで解釈し、技術的複雑性を抽象化
- Click-to-Ad: 商品ページURL → 2-5分で動画生成。2025年11月ローンチ以降、プロクリエイターの20%以上が採用
- UXへの寄与: モデル選択は手動だが、プランニングレイヤーでOpenAI LLMが自動的に意図→仕様変換を行うことで「何を作りたいか」だけ伝えれば済む体験を実現
- Moatへの影響 — 両刃の剣:
- 強化面: OpenAIモデルの深い統合(3層)によりUXが差別化。単にAPIを叩くのではなく、HF独自の「シネマティック・ロジック」がOpenAIモデルの上に構築されている
- 脆弱面: OpenAIへの依存が3層全てに及ぶ。OpenAIが価格改定・API廃止・直接競合サービスを出した場合、プランニングレイヤーごと再構築が必要。AT 1.0のリセラー問題(サプライヤーへの依存)がさらに深刻化
ファクト(自社モデルの正体):
- DoP(Director of Photography): 実態はプリセット/フィルターシステム
- 70種のシネマティックプリセット: FPVドローン、サイバーパンク、フレンチ映画リアリズム、Y2K、Medieval等
- ワンクリック適用 — 参入障壁は低いがUXとしては優れている
- Soul AI: ハイパーリアリスティック画像モデル(2025年6月〜)
- 「カメラライクな不完全性」を意図的に再現(ダスト、フラッシュ、グレイン)
- 「プラスチック感」除去 = AI生成画像のUncanny Valley対策
- Soul ID: Image-to-Imageエンジン、キャラクター一貫性維持
- Speak 2.0: プロンプトのみで音声(ナレーション、マルチスピーカー、コメディスキット)
- WAN 2.5ネイティブオーディオ: テキスト→動画にオーディオ統合(ポストプロダクション不要)
ファクト(推論・トレーニングインフラ):
- 推論: GMI Cloud(マネージドK8s + H100 GPU)→ レイテンシ65%削減、スループット3倍、コスト45%削減
(出典: GMI Cloud - How to Choose Best Video AI Model) - トレーニング: Nebius AI Cloud(NVIDIA HGX B200 = Blackwell世代GPU、各180GB HBM3eメモリ、H100比15倍の推論性能)
- 数十億パラメータの自社拡散モデル(画像編集+キーフレーム生成を単一フレームワークに統合)をトレーニング完了・本番運用中
- 多段階データカリキュラム: 720p→2K+へ段階的に解像度を上げ、データ品質も広範→厳選へ進化
- 分散オプティマイザー(activation checkpointingではなく)でGPUメモリ管理、cuDNN fused attention(Blackwell専用設計)
- ポストトレーニングにDPO(Direct Preference Optimization)— 人間評価者が候補出力をランキング
- DeepSeekの言語モデル推論トレーニング手法を動画生成に応用(★独自アプローチ)
(出典: Nebius AI Cloud - Higgsfield Case Study)
- エッジ: Gcore(将来的にEverywhere AI展開検討)
(出典: Gcore - Higgsfield Case Study) - Higgsfield MLフレームワーク(GitHub 3.5kスター): ZeRO-3 DeepSpeed、FSDP対応、数兆パラメータ対応
(出典: GitHub - higgsfield-ai/higgsfield)
ファクト(B2B戦略 — Mahi de Silvaの領域):
- プロダクトライン:
- Ads 2.0: マルチバリアント広告生成
- Soul UGC Builder: E-commerce向けマルチショット・ストーリーボード
- UGC Factory: UGCスタイル動画の大量生成
- Vibe Motion: モーショングラフィックス($10/動画、2026年2月ローンチ)
- ターゲット: Fortune 500企業、マーケティングエージェンシー
- 事例: Qatar Airways(2026年New Year Instagram投稿)
- E-commerce実績: 従来カメラマン必要 → 2時間で50本の商品動画作成
問い:
- モデル選択が手動 — 自動ルーティング未実装は技術的困難? 戦略的判断?
- DoPが「プリセットシステム」であることの意味 — 参入障壁は低いがUXとして価値は高い?
- Soul AIの「カメラ不完全性」— これが差別化なら、なぜモデル全体を自社開発しない?
- Nebius HGX B200で自社拡散モデルのトレーニング完了済み — 「後発的モデル開発」はもう始まっている
- E-commerce「2時間で50本」は本当なら革命的 — クリエイターではなくビジネスオーナーにとっての本当の価値はここ?
話すポイント:
- マルチモデルアーキテクチャの実態(手動選択、自動ルーティング未実装)
- DoPの正体(プリセット)とSoul AIの面白さ(カメラ不完全性の意図的再現)
- インフラスタック(GMI推論 + Nebius HGX B200トレーニング完了 + Gcore K8s)
- B2B戦略の具体性(Ads 2.0、UGC Factory、Vibe Motion)
- 「2時間で50本の商品動画」— 起業家/クリエイターが最も食いつくポイント
PART 5: 我々の学び・クロージング(5分)
仮説: Higgsfieldから学ぶべきは「速度」「PMF」「逆説」。疑問は「持続可能性」「アグリゲーター幻想」。EP1とEP2を貫くメタテーマは**「レイヤーの選択」**。
Higgsfieldから盗めること:
- 速度が正義: 「作らない」選択で9ヶ月$230M ARR
- PMF 3段階進化: ツール→プラットフォーム→インフラ(ブラウザ化が転換点)
- Snap経験の逆説: 「作る側」にいたからこそ「作らない方が速い」
- 哲学の明確さ: 「magic instantly, at scale」— アルゴリズム競争を降りる勇気
- 数字で語れる価値提案: $30 = $10,000(★未検証だが刺さるメッセージ)
- クリエイター・インセンティブ: 週次$100K + 15%コミッション = 自発的拡散エンジン
- チームの組み合わせ: 技術(Alex) × 研究(Yerzat) × GTM/B2B(Mahi) = 3脚が明確
Higgsfieldへの疑問:
- 持続可能か?: モデル依存、マーケターの忠誠心、API値上げリスク
- SNSになれるか?: Civitai教訓、モデレーションコスト、マーケターはネットワークに留まるか
- アグリゲーター vs リセラー vs 垂直ワークフロー: Ben Thompson的にリセラー寄り。しかしSivulka的に「プロセス・エンジニアリング企業」として見ると景色が変わる
- 品質収束は味方か?: Elo 21pt差 → コモディティ化はHFの正しさを証明しつつある?
- Adobe連携なし: プロクリエイターのワークフローに入れない
- Trustpilot 3.2/5の二極化: 何が起きている?
EP1との対比 — 「レイヤーの選択」:
- Every(EP1): AIの上にビジネスを建てた
- 自分たちが使うものを作り、売る(Skin in the Game)
- Agent-Nativeアーキテクチャで「コードの終焉」を再定義
- 「思想 + 実践 + コミュニティ」を持っている
- Higgsfield(EP2): AIの上にAIを載せた — しかし本当の価値は「ワークフローのエンコード」かもしれない
- 表面: 他社モデルを繋いでマーケターに提供するアグリゲーター
- 深層: 「40本/日の広告制作を回す」プロセスをソフトウェアに埋め込むプロセス・エンジニアリング企業
- Mashrabov: "We orchestrate the entire workflow... eventually deliver sales through videos"
- Sivulka: "Software is a stored process... an opinion for how a group of people should collaborate"
- HFが持つべきは「モデル」ではなく「特定チームの制作プロセスの理解」
- 共通の問い: 「何を自分で持つか」をどう決めるか?
- Every = 思想 + 実践 + コミュニティ
- HF = ワークフロー + フィードバックループ + コンテキスト(ブランドガイドライン、承認パターン)
- Higgsfieldの真の賭けは「モデルはコモディティ化する」ではなく「制作プロセスをエンコードした企業が勝つ」かもしれない
次回予告
収録前チェックリスト
必ず参照:
- references/Higgsfield_Market_Research_2026.md — 全ソース・ファクト
キー数値の確認:
- Higgsfield: $138M調達、$1.3B評価、$230M ARR(Sacra)/$200M(TC)、1,500万ユーザー、9ヶ月
- Midjourney: VCゼロ、$500-600M ARR予測、2,100万Discord会員、200万有料ユーザー
- Runway: $860M調達、$53億評価、Elo 1,247(1位) / Luma: $1B+、$40億+ / Kling: $240M ARR
- Alex Mashrabov: AI Factory $166M(2020年Snap買収)、母=ソ連宇宙ロケット設計
- Mahi de Silva: AdMarvel→Opera(1ヶ月収益10倍)、Amplify.ai→Triller CEO
未検証注意(★収録中に明示的にcaveatすべき):
ユーザー85%マーケター(36kr記載、「According to Reuters」としているがReuters原文に該当記述なし → 削除済み)- $30 = $10,000主張(自社主張、検証困難)
- MidjourneyのARR $500-600M(推定値、自社非公開)
- "Epstein Island"動画の100万RT超(36kr記載)
- Mashrabovの「競合はTikTok」発言の正確な文脈(Sacra記事内)
話すべき対比:
- モデル所有 vs アグリゲーター(市場コンセンサス vs HFの逆張り)
- クリエイター vs マーケター(IDが宿る道具 vs 乗り換えられる武器)
- アグリゲーター vs リセラー(Ben Thompson定義 + スチールマン5点)
- Every(EP1)vs Higgsfield(AIの上にビジネス vs AIの上にAI)
詳細リサーチ・ソース
各ソースは references/ に個別ファイルで格納。競合マップ・市場データのまとめは references/Higgsfield_Market_Research_2026.md を参照。
創業者思考・戦略
- Sacra - Alex Mashrabov on orchestrating AI video models
- Sacra - Higgsfield at $230M ARR
- Pivot - Open conversation with Alex Mashrabov
- Google Cloud Blog - 3 lessons from Higgsfield
- Adweek - $1.3B Startup Behind Madonna and Will Smith
- Evolving Edge - $0 to $50M ARR
- Analytics Insight - Mahi de Silva
技術・インフラ
- Nebius AI Cloud - Higgsfield Case Study
- Gcore - Higgsfield Case Study
- Higgsfield ML Framework (GitHub)
- Higgsfield Camera Controls
- Higgsfield Soul 公式
- Higgsfield Speak 2.0
ベンチマーク
市場データ
バイラル・マーケティング
競合・市場リサーチ(個別参照)
- TechCrunch - Higgsfield $1.3B Valuation
- Sacra - Higgsfield Profile
- TechCrunch - Runway $315M Series E
- Bloomberg - Runway $5.3B Valuation
- Fueler - Pika Labs Statistics
- Sacra - Pika Profile
- Yahoo Finance - Kuaishou/Kling Valuation
- AI Tool Analysis - Kling Complete Guide
- Luma AI Pricing
- Silicon Valley Investclub - Luma Profile
- WaveSpeed - Sora 2 Complete Guide
- CostGoat - Sora 2 Pricing
- Tracxn - Stability AI Profile
- Fueler - Stability AI Statistics
- Manila Times - Shengshu Series A+
- SCMP - Vidu Q2 Launch
- Wikipedia - MiniMax
- Rest of World - MiniMax IPO
- Pinggy - Best Video Generation AI Models
- PXZ.ai - Sora vs Runway vs Pika Comparison
- SQ Magazine - Midjourney Statistics
- Fueler - Midjourney Statistics
- Discord Case Study - Midjourney
- eesel.ai - Midjourney Pricing
- Midjourney Docs - Comparing Plans
- Demand Sage - Midjourney Statistics
- Medium - How Midjourney Built an AI Empire Without VC
- AI Tools DevPro - Midjourney Guide
- VentureBeat - Midjourney Custom Models
- Chris Dixon - Come for the Tool, Stay for the Network
- TechCrunch - Come for the tool reconsidered
- BrightSEOTools - Civitai Alternatives
- Vadoo - Civitai
- MIT Tech Review - AI Deepfakes Marketplace
- arXiv - Exploring Abusive Generative AI Models on Civitai
- 404 Media - Payment Processors and AI Porn
- TechRaisal - Tensor.Art Guide
- PixelDojo - Tensor.art vs Civitai
- PXZ.ai - Best Unrestricted AI Image Generator
- Cobusgreyling - AI Model Providers Moving Up
- Bitrue - OpenAI vs Anthropic
- GrayGrids - AI Aggregators
- Cybernews - Best AI Aggregators
- Stratechery - Aggregation Theory
- Medium - Aggregation Theory 2.0
Discordコミュニティ直近の話題(2026年2月22日)
ソース: Higgsfield Discord #general-chat(2026年2月22日 6:30〜9:20 JST)
1. Soul 2.0ローンチ直後の不安定さ
- Soul 2.0が公式ローンチ(Higgsie公式アナウンス済み)
- ローンチ直後から「Stuck In Progress」障害発生 — 複数ユーザーが20分以上生成待ち → Mod(Jollygreen12)が「既知の問題、DEVに報告済み」と対応
- 約30分後に復旧するも、生成速度は遅いまま
- ウォーターマークテキスト混入の報告 — Soul 2.0画像に意図しないテキストが表示される問題
- ボディプロポーション指示の不安定さ — プロンプト内の位置(先頭 vs 末尾)で結果が変わる
2. 複数モデルの同時障害
- Kling 3.0 Omni: 生成が開始されない、16時間以上処理中のまま停滞 → キャンセルも不可
- Nano Banana Pro: 「Job not found」エラー頻発、複数ユーザーが報告
- Flux Master: 「Please wait for the image to finish processing」エラーで生成不可
- Motion Control: 全生成が失敗(モバイル版特有の問題と判明)
- → 台本のTrustpilot 3.2/5二極化の裏付け: サービス不安定さがリアルタイムで観察できる
3. 料金プラン・特典の変更に対する不満
- Unlimited Nano Banana Proが新規サブスクライバー向けに廃止 — 既存ユーザー(Ultimateプラン)から「No way they removed...」と驚きの声
- 既存サブスクライバーは維持されるが、新規契約・プランアップグレードには適用されない
- $89初月サブスクリプションディールも終了
- Motion Control: Creator Planで以前は無制限だったが、現在は1日4回に制限(しかも失敗してもクレジット消費される)
- プランダウングレード方法が不明 — UIに選択肢がなく、DMで対応
- → 台本の「マーケター忠誠心」への疑問を補強: 特典変更への即座の不満
4. Seedance 2.0への高い期待
- 複数ユーザーが「Seedance 2.0はいつHFに来るのか」と質問(少なくとも3回)
- Higgsie公式回答: 「Stay tuned、公式チャネルとDiscordで発表する」
- ByteDance APIリリースの遅延情報も議論: 著作権・ディープフェイク対策のため「24日より大幅に遅延」 → 「Sora 2スタイルの実写顔ブロック」の可能性
- → 台本の「モデル依存リスク」の具体例: 外部モデルの方針変更がHFのサービスに直接影響
5. カスタマーサポートの実態
- Higgsie(公式チームアカウント)が積極的に対応 — ほぼ全ての報告にリプライ
- しかし対応パターンが画一的: 「スクリーンショットをDMで送ってください」「キャッシュクリア・ブラウザ変更を試して」
- DM対応の限界: 「DMが送れない」ユーザーへの対応、「たくさんのDMを順番に処理している」とMod説明
- キュー停滞の対応: 16時間停滞したジョブは「永遠に完了しない」→ DMでキュー手動クリア
- → AT 2.0のTrust構築とCS品質の問題が目の前で起きている
6. モバイル体験の問題
- Samsung S25 Ultra: グリッチ、20MB以上の画像読み込み不可、アセット削除時に隣のアセットが消える
- iPad: アプリがグリッチだらけ
- モバイルブラウザ版: Motion Controlが全て失敗(PC版では正常)、Face Swap結果が再生不可
- → ブラウザプラットフォーム(台本の「最大の転換点」)のモバイル品質に課題
7. コンテスト参加者の混乱
- Higgsfieldロゴ/ウォーターマークの動画への追加方法がわからない — 複数ユーザーが同じ質問
- Mod回答: 「Canvaで無料で追加できる」 — 公式ツール内に機能がない
- → プラットフォーム機能の不足 + コミュニティイベントの設計粗さ
8. NSFWコンテンツ管理
- NSFWコンテンツの投稿をModが即座に警告(fAIkout): ToS 5.3条を引用、アカウントBAN警告
- → 台本のCivitai教訓(モデレーション問題)がHFでも発生している兆候
9. Google Oneとの混同
- Google One Premium加入者がHiggsfield無料利用を期待して来訪 → 「完全に別のプラン」とMod回答
- → ユーザー獲得チャネルの混乱、ブランド認知の課題
コミュニティ観察まとめ(台本への示唆)
| 台本の論点 | コミュニティで観察された裏付け |
|---|---|
| Trustpilot 3.2/5 二極化 | Soul 2.0障害、Kling停滞、NBP「Job not found」— サービス不安定さがリアルタイムで確認 |
| AT 2.0のTrust自壊 | 画一的CS対応、DM依存、キュー手動クリア — スケールしないサポート体制 |
| モデル依存リスク | Seedance 2.0/ByteDance API遅延がユーザーの期待を直撃。Kling 3.0障害もHF側で制御不能 |
| マーケター忠誠心 | Unlimited NBP廃止・Motion Control制限に即座の不満。特典変更でチャーンリスク |
| ブラウザ化の転換点 | モバイル体験が未成熟。「最大の転換点」の品質担保に課題 |
| Civitai教訓 | NSFWコンテンツがDiscordでも発生。Modが即警告するも、動画のモデレーション困難は変わらず |
| Soul 2.0の面白さ | カスタムプロンプトで「AMAZINGG」な結果(Higgsie)、ユーザーも作品共有。一方で技術的不安定さ |