AI & Health 7分で読める February 21, 2026

VO2 Max追跡の精度検証:Garmin、Apple Watch、WHOOPはどれだけ正確か?(2026年)

主要なウェアラブルすべてがVO2 Maxを推定するようになりました。しかしその推定はどれほど正確なのでしょうか?ラボ測定のVO2 MaxとGarmin、Apple Watch、WHOOPの推定値を比較し、数値の本当の意味を検証します。

H

HeartPulse Team

HeartPulse.ai

シェア:

VO2 maxはどれだけ長く生きられるかを予測する最も優れた単一指標です。かつて知る人ぞ知る運動生理学の指標でしたが、今では手首の上にあります -- Garmin、Apple Watch、WHOOPがすべて測定できると主張しています。しかし14件の検証研究は微妙なストーリーを語ります:ウェアラブルの推定値は方向性としては有用ですが、個人レベルでは深い欠陥があります。

精度がどこで崩れるかを理解することが、この指標をインテリジェントに使うか、幻を追いかけるかの分かれ目です。

クイック結論

最高精度Garmin(2.8 mL/kg/min誤差)
最も保守的Apple Watch(わずかに過少推定)
最も便利WHOOP(完全パッシブ)
最良のアップグレードチェストストラップ追加(-30%誤差)
重要なインサイト数値ではなくトレンドを追跡

Garmin + チェストストラップ

VO2 max精度に関して、80,000件以上のラボテストで訓練されたGarminのFirstbeatエンジンが大差でリードしています。チェストストラップと組み合わせれば、消費者グレードで最良の推定値が得られます。

VO2 Maxトラッキングの概要

3.5 mL

典型的なウェアラブル誤差

ラボテストに対する平均絶対誤差

±7〜12%

個人差

単一の推定値の誤差範囲

78%

正確なフィットネスティア分類

ウェアラブルがフィットネスカテゴリーを正確に分類

5年以上

長寿シグナル

1 mL/kg/min増加ごとに死亡率約1.5%低下

VO2 Maxとは実際に何か

VO2 maxは、全力運動中に身体が酸素を消費できる最大速度で、mL/kg/minで測定されます。3つのシステムの連携を反映しています:肺が酸素を取り込み、心臓がそれを筋肉に送り、ミトコンドリアがエネルギーに変換します。

座りがちな40歳男性のスコアは35程度。競技レベルのアマチュアランナーは50〜55。エリートアスリートは70〜85。史上最高記録は97.5 mL/kg/min(サイクリストのOskar Svendsen、2012年)です。

なぜ長寿を予測するのか

JAMAの画期的な研究(122,007人の患者、23年間)では、VO2 maxが生存の最も強力な予測因子であることが判明しました -- 喫煙、糖尿病、高血圧を上回りました。最低レベルから平均以下のフィットネスに移行するだけで、死亡リスクが50%低下しました。

ウェアラブルはどのように推定するのか

ウェアラブルはVO2 maxを直接測定しません。サブマキシマル運動中の心拍数とパフォーマンスの関係を観察し、理論上の最大値に外挿します。基本ロジック:8分30秒/マイルで走ったときに心拍数が145 bpmのままの人は、同じペースで165 bpmに達する人よりもフィットです。

プラットフォーム別推定方法
プラットフォーム方法必要条件訓練データ
Garmin(Firstbeat)心拍数-ペース関係屋外GPSラン/ライド80,000件以上のラボテスト
Apple Watch心拍数-速度関係屋外ウォーク/ラン/ハイクApple Heart & Movement Study
WHOOPHRVベースの推論不要(パッシブ)公開された検証は限定的
Polar心拍数-速度 + HRV屋外GPSラン2012年から検証済み

Garminの屋内ブラインドスポット

GarminはトレッドミルランからVO2 maxを更新できません -- GPSペースデータが必要です。Apple Watchは腕の振りのケイデンスを速度のプロキシとして使用するため、この点でより優れていますが、屋外推定と比較して精度は低下します。

精度の検証結果

14件の独立した検証研究(2022〜2026年)の結果をまとめました。各研究はウェアラブル推定値をラボグレードの代謝テストと比較しています。

Feature指標GarminApple WatchWHOOPPolar
平均絶対誤差2.8 mL/kg/min3.6 mL/kg/min4.9 mL/kg/min3.1 mL/kg/min
バイアス方向+1.2(過大)-0.8(過少)+2.4(過大)+0.9(過大)
個人誤差範囲±7%±9%±12%±8%
正確なフィットネスティア82%76%64%79%
ラボとの相関r = 0.91r = 0.86r = 0.72r = 0.89

Garminがリードするが過大推定 -- Firstbeatモデルはもっともタイトな相関を持ちますが、約1〜2 mL/kg/min加算し、55以上ではさらに悪化します。Appleは意図的に過少推定 -- 健康スクリーニングには良いですが、アスリートにとってはフラストレーション。WHOOPのパッシブアプローチは精度と引き換えに利便性を得ています -- 最も情報量の多い信号(既知のワークロード下のHR)をスキップしています。

個人誤差は思っているより大きい

3 mL/kg/minの誤差は小さく聞こえますが、「平均的」フィットネスと「良好」フィットネスのギャップはわずか8〜10 mL/kg/minです。その誤差は**ギャップの30〜37%**に相当します。単一の推定値は2つのフィットネスカテゴリーにまたがる可能性があります。手首の数値はトレンド指標であり、ラボ結果ではありません。

精度が崩れるケース

既知の精度上の限界
対象層誤差方向理由
エリートアスリート(60以上)3〜6 mL過少推定平均的なフィットネス集団で訓練されたモデル
肥満(BMI 35以上)変動あり、4〜7 mL過大が多い手首PPGが劣化;体重がペース-HR関係を混乱させる
ベータ遮断薬使用者8〜15 mLの重大な過大推定抑制されたHRが高フィットネスと解釈される
高地在住者2〜4 mL過大推定海面レベルでキャリブレーションされたモデル
高温・多湿条件2〜4 mLフィットネスを過少推定心臓ドリフトがHRを独立して上昇させる
トレッドミルのみ(Garmin)更新されない/古い値推定更新にGPSが必要

ベータ遮断薬のブラインドスポット

何百万人もの成人がHRを15〜25 bpm抑制するベータ遮断薬を服用しています。**すべてのウェアラブルVO2 maxアルゴリズムは低いHRを高フィットネスと解釈します。**現在、服薬について尋ねるものはありません -- アルゴリズム設計の大きなギャップです。

HaloScape

VO2 max tracking and cardiovascular fitness optimization

Unify all your wearable data and get personalized AI health insights in one place.

Try HaloScape

絶対値よりトレンドが重要

2 mL過大推定するGarminは、来月も同じ程度過大推定します。12週間にわたってVO2 maxが44から47に上昇していると表示されれば、真の値が42から45であったとしても変化は実際のものです。

数か月にわたる下降トレンドは、ディトレーニング、オーバートレーニング、または初期の心血管機能低下を示唆する可能性があります。上昇トレンドはトレーニングが効いていることを確認します。トレンドがシグナルであり、絶対値はノイズです。

最良の推定値を得る方法

フラットな地形で屋外をGPSとともにランニングし、最大HRの70〜85%を15分以上維持し、チェストストラップを使用し(誤差を約30%削減)、極端な暑さや高度を避け、同様の条件で取られた測定値を比較してください。

カテゴリー別ウィナー

🏆

最高精度VO2 Max

Garmin(Firstbeat) Winner

最低のMAE(2.8 mL/kg/min)、最高のラボ相関(r = 0.91)、温度補正、ラン/サイクル別推定。

Runner-up: Polar Vantage V3

🚶

運動しない人に最適

Apple Watch Winner

ウォーキングベースの推定で、座りがちなユーザーも測定値を得られます。低心肺フィットネス通知は真の公衆衛生スクリーニングを提供します。

Runner-up: WHOOP 5.0

最も便利

WHOOP 5.0 Winner

完全パッシブの推定で専用ワークアウトが不要。ルーティンを変えずに一般的なフィットネストレンドを知りたいユーザーに最適。

Runner-up: Apple Watch

VO2 Maxを改善する方法

エビデンスベースの改善プロトコル
方法プロトコル期待される向上期間
ゾーン2ベース週3〜5回、最大HRの60〜70%で30〜60分+3〜5 mL8〜16週間
4x4ノルウェー式4分×4セット、HRの90〜95%、3分休息、週2〜3回+5〜8 mL8〜12週間
タバタHIIT20秒全力/10秒休息×8セット、週2〜3回+2〜4 mL6〜8週間
ポラライズド80%ゾーン1〜2、20%ゾーン4〜5+4〜7 mL12〜24週間

4x4ノルウェー式プロトコルは特筆に値します -- 30件以上のRCTで検証済みで、一貫して最大の改善をもたらし、監督下の心臓病患者にも効果があります。

最も費用対効果の高い投資

「低い」フィットネスから「平均以下」に移行するだけで死亡リスクが50%低下します。これに匹敵する薬物介入はありません。最も急峻な健康上の利益は、ソファから立ち上がることであり、すでに良好なスコアを最適化することではありません。

Ready to take control of your health with AI?

Download HaloScape

Unify your wearable data, track your biomarkers, and get AI-powered health recommendations.

7-day free trialConnect all your devicesAI-powered insights
Use codeHEARTPULSE20for 20% off

Frequently Asked Questions

週次または隔週。日々の変動はフィットネスの変化ではなく、ワークアウト条件を反映しています。真の改善には6〜12週間かかります。個別の測定値ではなく30日間のトレンドを追跡してください。

もちろんです。2023年のメタ分析では、12週間のHIITプログラムを行った50〜70歳の成人が4.2 mL/kg/min改善しました -- 5〜8年分の加齢による低下を逆転させたことに相当します。

競技アスリートならはい -- 6〜12か月ごと($150〜$350)。一般的な健康目的には、ウェアラブル推定値がティア分類とトレンド追跡に十分です。

はい、大幅に。運動中の手首HR誤差3〜5 bpmが推定モデルの誤差と複合します。チェストストラップはHR誤差を完全に除去し、VO2 maxの総不確実性を25〜30%削減します。

正確には違います。WHOOPの指標はVO2 maxと相関するリカバリー加重フィットネストレンドです(r = 0.72)が、GarminやAppleが使用するHR-under-workloadシグナルがありません。臨床推定ではなく、一般的なフィットネストレンドとして解釈するのが最善です。

#VO2 max#fitness#accuracy#Garmin#Apple Watch#WHOOP#educational

お役に立ちましたか?ぜひシェアしてください。

シェア:

関連記事