Smartwatch mit Panda auf dem Fahrrad
| | | | |

Die Vermessung der Gesundheit: Wie valide sind Smartwatches wirklich?

Wie vertrauenswürdig sind eigentlich die „Messwerte“ der heutigen Smartwatches? Genaues Messen durfte ich schon in der HTL lernen. Mein Sportstudium finanzierte ich mir als Verkäufer von Pulsuhren in einem bekannten Sportgeschäft in Wien. Doch ich verkaufte nicht nur die Sportuhren, sondern trainiere selbst seit Anfang der Nullerjahre damit. Ich kann somit auf eine lange Geschichte und viel Erfahrung mit Sportuhren zurückblicken. Doch wie valide und zuverlässig sind die Messdaten wie Geschwindigkeit, VO2max, Stressscores, Schlafscores oder Blutzucker eigentlich? In diesem Artikel setze ich mich somit mit der Entwicklung und Validität der Messdaten von unseren technologischen Trainingsbegleitern fundiert auseinander.

Die zentralen Erkenntnisse, gleich zu Beginn:

Meine Reise durch die Geschichte der Sportuhren

Vom Gefühlsläufer zum Datensammler

Ich kann mich noch gut daran erinnern, als ich zu Beginn dieses Jahrhunderts, in etwa im Jahr 2003, mit dem Laufsport begann. Ich genoss die wunderbare Gegend und lief regelmäßig über die Feldwege der Weinviertler Weinberge und durch die umliegenden Wälder mit Brombeersträuchen. Manchmal blieb ich da auch kurz stehen um mich zu stärken.

Erst Monate zuvor hatte ich das Hermann Maier Trainingsprogramm gelesen, und noch vor Beginn meines Sportstudiums habe ich mich in voller Faszination über die Anpassungsfähigkeit des menschlichen Körpers in die Welt von systematischem Ausdauertraining und Laktatkurven eingelesen. Ich genoss  jedes Training, auch wenn es anstrengend war und mir bei 30 Grad Celsius der Schweiß runtergeronnen ist. Aber auch dann, wenn ich bei Minusgraden durch den Tiefschnee joggte.

Mit Körpergefühl zu ersten Messdaten

Damals lief ich noch ohne Pulsuhr. Sehr nach Körpergefühl. Ich orientierte mich an damals gängige Lauftipps wie langsames Joggen, dem Sprechen können beim Laufen oder dem Messen des Pulses mit der Pulsuhr. Nach einigen Wochen regelmäßigen Trainings merkte ich deutliche Verbesserungen meines Körpergefühls und meiner Laufleistung. Meine Laufzeit bestimmte ich über die Küchenuhr, welche ich beim Loslaufen und bei meiner Rückkehr ablas. Die Zeitdifferenz war meine Laufzeit. Irgendwann montierte ich mir eine einfache Casio-Uhr um zumindest die Laufzeit abzulesen.

So trainierte ich eine Zeitlang. Meine größte und längste Trainingsunterbrechung seit 20 Jahren hatte ich dann vom November 2003 bis Mai 2004. In dieser Zeit war ich für ein halbes Jahr als Tramper in Australien unterwegs um etwas von der Welt zu sehen. Erkunden, Erleben und Erfahren! Als ich nach Österreich zurückkehrte, begann ich sofort wieder mit dem Lauftraining und kaufte mir meine erste Pulsuhr. Damals eine simple Polar, welche die Zeit und den Puls messen konnte.

Technologische Sprünge der Sportuhren

Ich begann mit dem Sportstudium und zog ein Jahr später nach Wien. Um mir meinen Lebensunterhalt und Studium zu finanzieren, arbeitete ich mehrere Jahre in der Team- und Laufsportabteilung eines bekannten Sportriesen. Die Kenntnis aller gängigen Sportuhren war Teil meines Jobs.

Während dem Sportstudium begann ich mein Training zu dokumentieren und zu systematisieren, da ich meine Leistung für den Triathlon verbessern wollte. Da ich damals nicht das Geld für einen zuverlässigen Schrittzähler hatte, kaufte ich mir einen billigen Tachometer für das Fahrrad und fuhr die Strecke nach dem Lauftraining nochmal mit dem Fahrrad ab. Als ich etwas Geld angespart hatte, kaufte ich mir eine Polar RS 625X. Das war damals das Maß aller Dinge unter den Sportuhren, denn diese hatte nicht nur sehr viele Funktionen, sondern auch einen KM-Zähler für den Schuh. Ich kam mir richtig High-Tech vor! 😀

Doch zugleich war das Überspielen der Daten auf die Software mittels Infrarot-Stick sehr unzuverlässig, zeit- und energieraubend. Ich dachte mir damals als junger Sportstudent schon, dass es doch einfacher wäre, mit einem GPS-Empfänger durch die Gegend zu laufen, den man dann einfach mit dem Internet verbinden könne. Der Umsetzung dieser Idee kam – unabhängig von mir – ein gewisser Florian Gschwandter zuvor, welcher mit der App Runtastic megaerfolgreich wurde. Gratulation an den Umsetzer! 😉

Die Industrie der Wearables sowie Smartwatches

Im Folgenden möchte ich eine Einordnung der Smartwatches als Milliardenindustrie herstellen. Dies ist insofern von Bedeutung, da die Smartwatches einerseits leicht zugängliche und kostengünstige Vermessung der Gesundheit ermöglichen und sich andererseits hervorragend Geld damit verdienen lässt.

Dies ist im Kontext der Validität der erhobenen Daten als auch der errechneten Parameter und Scores interessant, da die Marktmacht der Wearablehersteller auch von der Glaubwürdigkeit der angezeigten Gesundheitsdaten abhängig ist. Zur Validität komme ich noch, aber vorher folgt noch eine Zusammenfassung der relevanten weltweiten Marktdaten.

Smartwatches sind per se keine neue Technologie

Wearables am Handgelenk sind kein neues technologisches Phänomen. Meinen Recherchen zufolge war die erste Smartwatch das Modell „Pulsar digital watch“ von Hamilton. Und auch zu meinen aktiven Zeiten als Sportstudent in den frühen 2000er-Jahren nannte man es Pulsuhren bzw. GPS-fähige Sportuhren von Anbietern wie Polar, Garmin oder Suunto. Für diese Frühphase fehlen mir allerdings belastbare weltweite Bestands- und Bevölkerungsquoten.

Der Siegeszug der Smartwatches als digitale Alleskönner

Der eigentliche globale Smartwatch-Massenmarkt entwickelte sich jedoch erst in den 2010er-Jahren. Nach aktuellen Marktübersichten nutzten weltweit 323,99 Millionen Menschen im Jahr 2023 eine Smartwatch und 454,69 Millionen im Jahr 2025. Bei einer Weltbevölkerung von rund 8,05 Milliarden Menschen im Jahr 2023 entspricht dies etwa 4 % der Weltbevölkerung, während der Anteil 2025 bereits ungefähr 5–6 % beträgt. (ElectroIQ, 2025; World Bank, o. J.; Market.us, 2026)

Wie hoch ist der weltweite Umsatz an Smartwatches?

Parallel dazu entwickelte sich ein wachsender globaler Markt. Der weltweite Umsatz mit Smartwatches lag 2021 bei rund 30,4 Milliarden US-Dollar (Grand View Research, 2022) und 2022 bei etwa 42,7 Milliarden US-Dollar. Aktuelle Marktanalysen beziffern das globale Marktvolumen 2025 auf rund 38,53 Milliarden US-Dollar. (Allied Market Research, 2023; Fortune Business Insights, 2025)

Insgesamt zeigen diese Zahlen, dass sich Smartwatches innerhalb von etwa zehn Jahren von einer Nischentechnologie zu einem weltweit verbreiteten digitalen Gesundheits- und Lifestylegerät entwickelt haben.

Wearables heute

Technologische Alleskönner am Handgelenk

Die Sportuhren und Wearables von heute sind kaum mehr mit den damaligen Geräten vergleichbar. Auch wenn manche Basistechnologien (z.B. für Pulsmessung) das selbe Messziel verfolgen (EKG oder PPG), so haben sich die Zuverlässigkeit, Funktionsvielfalt, Algorithmen und Konnektivität deutlich verbessert. Heute ist es sogar kein Problem mehr an der Supermarktkassa mit einer Sportuhr zu bezahlen. Den 10 Euroschein im Laufbeutel vergessen? Kein Problem! Nachrichtenempfang und Telefonieren? Auch kein Problem mehr!

Was ist „Validität“ bei Smartwatches?

Validität (=Gültigkeit) beschreibt, wie genau ein Messwert den tatsächlichen biologischen Zustand (z.B. Stress) widerspiegelt.

Bei Wearables bedeutet das:
Wie stark weicht ein Wert vom Goldstandard ab? (z. B. Spiroergometrie, EKG, EEG)
Wird tatsächlich das gemessen, was angezeigt wird oder nur indirekt geschätzt?

Typische Validierung:
Vergleich von Smartwatch-Daten mit Laborverfahren
Berechnung von Abweichungen (z. B. MAPE, Korrelationen)

Wichtig:
Viele Smartwatch-Werte sind keine direkten Messungen, sondern algorithmische Schätzungen. Ihre Validität ist daher begrenzt.

Wie valide sind Smartwatches eigentlich?

Gleich vorweg: Viele Messwerte bei den Smartwatches werden nicht wirklich gemessen, sondern über firmeneigene Algorithmen berechnet. Abgesehen vom Rechenmodell, führen die wenigen tatsächlich gemessenen Messwerte zu verzerrten Ergebnissen. Zunächst möchte ich auf die Problematik zwischen Messwerten und errechneten Kennwerten eingehen. Im Anschluss werde ich die Validität von Blutzucker-, VO2max -, HRV-Werten und Stressscores unter meine Lupe nehmen.

Was wird bei Wearables überhaupt gemessen, und was nur berechnet?

Grundsätzlich ist bei den angezeigten Werten von Wearables und Fitness-Apps zwischen gemessenen und berechneten Werten zu unterscheiden. Um den Unterschied anhand eines Alltags-Rechenbeispiels deutlich zu machen:

Die Länge und Breite einer Tischplatte wird gemessen (z.B. mit einem handelsüblichen validierten Maßband). Die Tischfläche wird allerdings nicht „gemessen“, sondern eben auf Basis einer simplen Formel berechnet. Kleine Messfehler mit dem Maßband, wirken sich allerdings mehrdimensional auf das Flächenergebnis aus. Bei Smartwatches und Fitness-Apps ist das Ganze dann noch ein großes Stück komplexer.

Das habe ich mir mal näher angesehen. Bei näherer Betrachtung sieht das so aus wie in der folgenden Auflistung:

Messwerte

  • Dauer
  • Bewegungssignale (z.B. P-Kristalle, MEMS)
  • Position (GPS)
  • PPG-Werte (mit Brustgurt auch EKG-Signal)

Berechnete Werte, Parameter bzw. Scores

  • HRV
  • Stress
  • Distanz
  • VO2max
  • Blutdruck
  • Schrittzahl
  • Sturzsignale
  • Treppenanzahl
  • Geschwindigkeit / Pace
  • Sauerstoffsättigung SpO2
  • Route (via GPS-Daten)

Ist die Messung von Blutzucker bei Smartwatches zuverlässig oder eher gefährlich?

Ein gesundheitliches Risiko ist die angebliche Messung des Blutzuckerspiegels über Smartwatches. Smartwatches können derzeit keinen Blutzucker messen. Sie können lediglich Daten eines externen Glukosesensors anzeigen, der im Gewebe platziert ist. Doch dies ist zumeist nicht der Fall. Nicht-invasive Blutzuckermessungen über das Handgelenk gelten weiterhin als technologisches Entwicklungsziel, sind jedoch bislang nicht klinisch valide umgesetzt.

Was haben Blutzuckermessungen bei Smartwatches mit einer Banane zu tun?

Smartwatches versuchen Gesundheitsdaten häufig über optische Sensoren zu erfassen, die mit Lichtsignalen Veränderungen im Gewebe analysieren (Photoplethysmographie). Das ist zudem dieselbe Messmethode, mit welcher Smartwatches auch den Puls berechnen.

Eine direkte Blutzuckermessung ist damit jedoch derzeit technisch nicht möglich. Die Stiftung Warentest warnte daher vor Smartwatches und Apps, die eine Blutzuckermessung ohne invasiven Sensor versprechen. In einem Test zeigte sich die mangelnde Validität besonders anschaulich: Eine vermeintliche Messfunktion lieferte sogar dann einen Blutzuckerwert, als der Sensor auf eine Banane gehalten wurde (Stiftung Warentest, 2024).

Superfaktor VO2max – Algorithmen VS Laborwerte

Gleich vorweg: Wer einen vertrauenswürdigen VO2max Wert haben möchte, kommt um eine Leistungs-Spirioergometrie (=Gold-Standard) nicht herum. Die Begründung folgt:

Die VO2max ist ein hochrelevanter sportmedizinischer Parameter und sagt die Ausdauerleistungsfähigkeit als auch mögliche Wettkampfzeiten (wie z.B. beim Marathon) besser voraus als alle anderen Werte. Schon klar, Wettkampfleistung hängt auch von anderen Faktoren ab. Aber die VO2max ist ein dominanter Parameter. 

Während die Longevity-Szene seit ein paar Jahren von der VO2max schwärmt, war dieser Parameter bereits im Sportwissenschafts-Studium Anfang der 2000er Jahre im Fokus. Die VO2max ist nämlich nicht nur ein Leistungsparameter, sondern auch ein starker Indikator für Gesundheit und Langlebigkeit.

Im Folgenden präsentiere ich meine Analyse unterschiedlicher Validitätsstudien der Berechnung von VO2max -Werten bei unterschiedlichen Smartwatch-Modellen und Leistungsklassen. Wichtig dabei: Smartwatches messen keine VO2max -Werte, sondern berechnen sie auf Grundlage eines komplexen Algorithmus.

Validität der VO2max Werte bei Sportuhren

Studie (Autor, Jahr)Wearable / ModellPopulationValidierungsmethode / VergleichZentrale Ergebniskennzahl (VO₂max-Abweichung)Kernbefund / Interpretation
Engel et al., 2026Garmin Forerunner 245Moderat vs. sehr trainierte LäuferVergleich mit Labor-VO₂maxMAPE ~3–4 % (moderat), ~9–10 % (hochtrainiert)Gute Plausibilität bei moderatem Level, deutliche Unter-/Überschätzungen bei sehr Trainierten
Carrier et al., 2025Garmin fēnix 6Gemischte AlltagspopulationVergleich mit Labor-VO₂maxMAPE ~7.05 %Akzeptable Schätzwerte in gemischter Stichprobe, aber kein Ersatz für Labormessung
Carrier et al., 2020Garmin fēnix 3 HRFreizeitaktiveVergleich mit Labor/ReferenzAbweichungen vorhanden, teils systematischFrühere Evidenz zeigt valide Richtung, aber je nach Kontext messbare Abweichungen
Passler et al., 2019Garmin (z. B. Forerunner 920XT)Aktiv + inaktiveVergleich mit Labor-VO₂max & EEMAPE ~7.3 % bei Forerunner, aber einzelne Geräte teils besser/schlechterMixed-Ergebnisse, deutliche Unterschiede zwischen Geräten/Parametern
Železnik Mežan et al., 2025 (Review)Versch. Wearables / Firstbeat-AlgorithmenMehrere Studien/PopulationenQualitativ versch. ValidierungsmethodenGesamt: variable Fehlermaße, tendenziell akzeptabelWearables liefern brauchbare Schätzungen, sind aber kein Goldstandard – Leistungsniveau & Testbedingungen beeinflussen stark

Wichtig: Smartwatches „messen“ keine VO2max-Werte, sondern berechnen diese nur!

Wie komme ich nun zu genauen VO2max-Werten?

Wenn du wissen willst wie hoch deine VO2max tatsächlich ist oder auch mit deiner Smartwatch- VO2max vergleichen willst (persönliche Mini-Validierung), dann brauchst du definitiv eine Belastungsspirioergometrie bei Spezialist:innen. Es gibt zwar auch sportwissenschaftliche Leistungstests zur Bestimmung der VO2max wie z.B. den Shuttle-Run, aber dient ebenfalls nur als Orientierung und hat nur eine begrenzte Validität.

Wie valide sind HRV-Messungen bei Smartwatches?

Woher kommt mein Interesse für die Stresswerte bei Smartwatches?

Vor allem in meinem privaten Umfeld werde ich häufig nach meiner Einschätzung zu den Stresscores als auch der sogenannten „BodyBattery“ gefragt. Ich persönlich nutze diese Kennwerte bei Smartwatches nicht. Daher habe ich meine Fragensteller gebeten, mir in ihrer APP die Infoseiten (z.B. Garmin Connect-App) zur Berechnung der Stresswerte zu zeigen. Dabei habe ich festgestellt, dass die Erklärungen häufig sehr schwammig und messtechnisch unpräzise dargestellt werden. Dies macht es teilweise unmöglich die Kennwerte wie Stressscores und HRV nachzuvollziehen.

Dabei möchte ich auch hervorheben, dass ich in meiner beruflichen Funktion als Sportpsychologe beim ÖBS auch regelmäßig mentale Leistungstest mit Unterstützung eines mitlaufenden professionellen und hochwertigen Biofeedback-Systems (Nexus und Biotrace) durchführe. Die Genauigkeit der Messwerte, Datentransparenz und Komplexität ist dabei den Algorithmen von Smartwatches weit überlegen.

Ist die HRV zur Beurteilung von psychischem Stress geeignet?

Die Herzratenvariabilität (HRV) gilt als sensibler Indikator autonomer Regulationsfähigkeit. In der Praxis wird die HRV häufig mit der Bewertung des Stresszustandes gleichgesetzt. Doch psychologisch betrachtet lässt sich dies nicht so vereinfachen, da psychischer Stress auch kontextabhängig (z.B. Konflikte, strukturelle und situative Anforderungen, mentale Bewertungsprozesse).

Während HRV im medizinischen Kontext über Elektrokardiographie (EKG) als Goldstandard erfasst wird, nutzen Sportuhren und Wearables meist optische Sensoren (Photoplethysmographie, PPG) in Kombination mit proprietären (firmeneigenen) Algorithmen. Studien zeigen, dass Wearables unter ruhigen Bedingungen, insbesondere während des Schlafs, brauchbare HRV-Trends liefern können, jedoch nicht die Präzision einer EKG-Messung erreichen (vgl. Theurl et al., 2023; Dial et al., 2025).

Wie genau sind die für die HRV so zentralen rMSSD-Werte bei Smartwatches?

Ein zentraler Kennwert bei HRV-Messungen ist der rMSSD-Wert und wird in Millisekunden [ms] angeführt. Kurzzeit-Parameter wie der rMSSD-Wert weisen dabei häufig nur moderate Übereinstimmung mit EKG-Messungen auf (vgl. Theurl et al., 2023; Miller et al., 2022). Die Validität hängt stark von Messbedingungen, Artefaktkontrolle und Gerätemodell ab. Nächtliche Ruhephasen zeigen deutlich stabilere Ergebnisse als Messungen während Bewegung oder Alltagsaktivität (vgl. Dial et al., 2025; Hernando et al., 2023). Smartringe wie der Oura Ring scheinen hierbei übrigens besser abzuschneiden als Smartwatches, welche auf PPG-Messungen basieren. Obwohl die Ringe dieselbe Messtechnologie wie die Smartwatches verwenden (PPG-Sensoren), weisen diese häufig validere Werte auf. Dies scheint auf die bessere Messbarkeit bei den Blutgefäßen der Finger zurückzuführen zu sein.

Insgesamt deutet die Evidenz darauf hin, dass Wearables zur Beobachtung individueller HRV-Trends geeignet sind, jedoch nicht als diagnostischer Ersatz für medizinische HRV-Messungen verstanden werden sollten (vgl. Hernandez, 2025). Entscheidend bleibt daher die Einordnung im Kontext sowie die Betrachtung längerfristiger Muster statt einzelner Tageswerte.

Validität der von HRV- sowie rMSSD-Werten bei Sportuhren

StudieGeräteSettingHRV-ParameterValidität vs. EKGZentrale Erkenntnis
Theurl et al., 2023Smartwatch (klinischer Kontext)RuherMSSD, SDANN u.a.Gute Übereinstimmung für globale HRV; rMSSD nur moderat (Konkordanz ~0.66)Wearables können HRV erfassen, aber Kurzzeit-Parameter weniger exakt
Dial et al., 2025Garmin Fenix 6, Oura Gen3/4, Polar, WhoopNächtliche Messung (536 Nächte)rMSSDOura sehr hohe Übereinstimmung (MAPE ~6–7%, CCC ~0.97–0.99); Garmin schwächerHRV im Schlaf robuster; deutliche Geräteunterschiede
Miller et al., 2022Garmin Forerunner 245 u.a.Schlaf & RuherMSSDHR gut valide; HRV nur moderate Übereinstimmung (geräteabhängig)HRV deutlich sensibler für Artefakte als Herzfrequenz
Hernandez, 2025Mehrere WearablesLängsschnittRuhe-HRVKleine bis moderate Assoziationen mit GesundheitsparameternWearable-HRV hat Gesundheitsbezug, aber begrenzte Aussagekraft
Hernando et al., 2023Oura RingNächtliche RuheZeit- & FrequenzdomäneSehr hohe Übereinstimmung mit EKGPPG-HRV kann nachts sehr valide sein

Was bedeutet die mangelhafte Genauigkeit der HRV-Werte folgend für die Stressscores bei Smartwatches?

Streng genommen sind HRV-Werte (z.B. rMSSD-Werte) noch kein „Stressparameter“, sondern vielmehr ein Indikator für die Regulationsfähigkeit des Herzens. Um von tatsächlichem psychischem Stress zu sprechen, braucht es mehr Kontext über die jeweilige Situation (z.B. hohe Arbeitsbelastung, Beziehungskonflikte, Ruminationen,…).

Die „Stresscores“ sowie die sogenannte „Body Battery“ ziehen übrigens auch die HRV-Werte zur Beurteilung von Stress heran. Allerdings werden für diese Scores noch viele weitere Daten (z.B. Schlaf, Bewegung, etc.) herangezogen. Der Algorithmus für diese Berechnung ist allerdings ein firmeneigenes Rechenmodell, weshalb sich die Berechnungsmethode ohne nähere Einblicke nicht prüfen lässt.

Meine persönliche Empfehlung ist es, die Stressscores bestenfalls zur Trendbeobachtung heranzuziehen, aber keinesfalls zur Bewertung des aktuellen Stresszustandes. Hier empfehle ich den Fokus stärker auf das eigene Stresserleben und Selbstreflexion zu legen, anstatt blind auf die Daten zu vertrauen. Vor allem Achtsamkeitspraktiken erachte ich hierfür als sehr sinnstiftend!

Wie valide sind die Beurteilung der Schlafqualität und Schlafphasen bei Wearables?

Wie valide sind Schlafscores von Wearables im Vergleich zu EEG-Messungen?

Wearable-Schlaftracker nutzen Sensoren für Bewegung, Herzfrequenz und oft PPG-Signale, um Schlafqualität und verschiedene Schlafstadien abzuleiten. Diese Modellberechnung der Schlafqualität (Schlafscores) kommen allerdings nicht an die Genauigkeit von Gehirnwellenmessungen (EEG) heran.

Polysomnographie (PSG) bleibt der klinische Goldstandard, weil sie neben Herz und Bewegung vor allem EEG-Messungen der Hirnaktivität nutzt. Vergleichsstudien zeigen, dass Wearables Gesamtschlafdauer und Schlaf-/Wach-Erkennung meist brauchbar abbilden, die Genauigkeit bei der Zuordnung einzelner Schlafstadien (z. B. Tiefschlaf vs. REM) jedoch deutlich variiert und von Gerät zu Gerät unterschiedlich stark vom PSG-Goldstandard abweicht (vgl. Schyvens et al., 2025; Svensson et al., 2024).

Mein Tipp: Wenn es die Beurteilung der Schlafqualität geht, so bevorzuge ich einen Achtsamkeitsbasierten Ansatz und höre stärker auf dein Gefühl! Ich frage mich selbst: Wie habe ich geschlafen? Und wie erholt fühle ich mich?

Wie lässt sich die Qualität der Schlafscores und der Schlafphasen bei Wearables (Smartwatches, Ringe) zusammenfassen?

  • Total Sleep Time (TST) (Gesamtschlafdauer) kann Wearables meist gut approximieren.
  • Schlafphasen-Zuweisungen variieren stark zwischen Geräten und Algorithmen.
  • Wachphasen werden von vielen Sensoren häufig unterschätzt.
  • Sensitivität (Schlaf korrekt erkennen) ist meist hoch, Spezifität (Wachheit korrekt erkennen) deutlich niedriger.

Wann das Streben nach perfekten Schlafscores auch die psychische Gesundheit beeinträchtigen?

Ja, und sogar die Schlafqualität selbst. Der Fachbegriff für dieses Phänomen ist Orthosomnie. Orthosomnie bezeichnet eine übermäßige Fixierung auf Schlaftracker-Daten, die paradoxerweise mit mehr Schlafängsten und suboptimalem Schlafverhalten einhergehen kann. Der Begriff wurde erstmals klinisch beschrieben, als Patienten ihre Schlaftracker-Ergebnisse überkorrekt interpretierten und dadurch Schlafprobleme verstärkten (vgl. Baron et al., 2017). Neuere epidemiologische Untersuchungen deuten darauf hin, dass orthosomische Muster bei Nutzer:innen von Wearables nicht ungewöhnlich sind und mit stärkerer Insomnie-Symptomatik assoziiert sein können (vgl. Jahrami et al., 2024).

Qualitative Analysen untermauern, dass die ständige Beschäftigung mit Schlafmetriken Angst und zwanghafte Verhaltensweisen verstärken kann (vgl. Jahrami et al., 2023). Diese Forschung legt nahe, dass Schlaftracking sowohl ein hilfreiches Werkzeug als auch ein potenzieller Motor für ungesunde Selbstüberwachung sein kann. Je nachdem, wie stark die Daten in die psychologische Bewertung des eigenen Schlafs einfließen.

Wie lassen sich die Abweichungen vom Laborwert für die Trainings- und Wettkampfpraxis sowie Gesundheit einordnen?

Ähnlich wie bei der VO2max, haben auch die HRV-Messwerte bei Sportuhren einen Durchschnittsfehler (MAPE / Durchschnittliche Abweichung vom Laborwert) bis 3% bzw. 10 %, wobei der Durchschnittsfehler bei gut Trainierten bis Elite-Athlet:innen systematisch höher ist. Die Abweichungen sind übrigens in beide Richtungen (also nach oben oder unten) möglich.

Das hört sich zunächst nicht viel an. Aber: Wenn man bedenkt, dass eine Sportuhr einen VO2max-Wert von 55 anzeigt, während die wirkliche und biologische VO2max 51 beträgt, dann ist dieser Fehler schon hochrelevant. Erheblich vor allem dann, wenn aufgrund der angezeigten VO2max der Fitnesswert bestimmt wird, worauf auch Trainings- und Wettkampfpläne aufgebaut werden können.

Auch meine Sportuhr hat eine – aus meiner Sicht – höhere VO2max und deutlich schnellere prognostizierte Marathonlaufzeit angezeigt, als ich es selbst mit meinem Trainingszustand eingeschätzt hätte. Und das, obwohl ich seit Jahren meine Garmin mit Trainingsdaten (incl. Brustgurt-Messung) gefüttert habe. Den Marathon bin ich dann gelaufen, doch bei der Zielsetzung meiner Marathon-Laufzeit habe ich vielmehr auf meine langjährige Trainingserfahrung, Wissen über Trainingsplanung (bin ja auch Sportwissenschafter) und mein Körpergefühl geachtet. Der VCM Marathon 2025 selbst war megaanstrengend, körperlich und auch mental hat er mir alles abverlangt. Mit anderen Worten: Die Zielzeitprognose laut meiner Sportuhr war utopisch. Aber: Das von mir gesteckte Zeitziel habe ich knapp erreicht.

Mein Fazit:

Smartwatches liefern heute eine beeindruckende Menge an Gesundheitsdaten. Doch nicht alle Werte sind gleich zuverlässig. Hintergrund: Der Großteil der Kennwerte wird nicht wirklich gemessen, sondern berechnet. Professionellen Geräten mit präziser Sensorik können Smartwatches somit nicht das Wasser reichen.

Für Trainingstrends und Selbstbeobachtung können Smartwatches und andere Wearables durchaus hilfreich sein. Wer zuverlässige und valide Kennwerte und Parameter, z.B. für die Trainingssteuerung oder Stressbeurteilung benötigt, der sollte zum Spezialisten gehen.

Ungeachtet der Validität und Zuverlässigkeit der Messwerte, sowie den daraus errechneten Parametern (teilweise auf Grundlage falscher Messdaten), gibt es auch noch einen psychologischen Aspekt zu berücksichtigen: Eine Fixierung auf Parameter und Scores hat einen Effekt auf das Wohlbefinden, das mentale Erleben und auch das Gesundheitsverhalten. Doch mehr dazu möchte ich in einem separaten Artikel erörtern.

Ich persönlich sehe die Kennwerte bestenfalls als eine Orientierung, doch noch vielmehr vertraue ich auf mein Körpergefühl und achtsamkeitsbasierte Ansätze. Denn Körpergefühl und Gesundheit ist etwas, was Wearables niemals ersetzen werden können.

FAQ – Validität und Zuverlässigkeit von Smartwatches

Das hängt stark von der verwendeten Sensorik (z.B: PPG-Sensoren VS EKG-Sensoren für die Herzfrequenz) und vom jeweiligen vom Messwert ab. Herzfrequenz und einfache Aktivitätsdaten sind oft brauchbar, aber weniger genau als EKG-Messungen. Komplexere Kennwerte wie VO₂max, HRV, Schlafphasen oder Stressscores sind deutlich fehleranfälliger.

Nein. Smartwatches messen die VO₂max nicht direkt, sondern berechnen sie auf Basis von Bewegungs-, Herzfrequenz- und Profildaten. Doch auch diese errechneten Parameter haben durchschnittliche Abweichungen von 3-10 %.

Für langfristige Trends können sie nützlich sein. Für die präzise Beurteilung des aktuellen psychischen Stresszustands sind sie jedoch nur eingeschränkt geeignet.

Die Gesamtschlafdauer wird häufig ganz brauchbar geschätzt. Die Zuordnung einzelner Schlafphasen wie Tiefschlaf oder REM ist deutlich ungenauer als im Schlaflabor.

Derzeit nein. Smartwatches können höchstens Daten externer Glukosesensoren anzeigen. Eine valide nicht-invasive Blutzuckermessung am Handgelenk ist bisher nicht etabliert.

Ja, aber mit Einschränkungen. Für Trendbeobachtung und grobe Orientierung können sie hilfreich sein. Wer exakte Werte für Leistungsdiagnostik oder medizinische Fragestellungen braucht, sollte auf spezialisierte Verfahren zurückgreifen.

Ja. Eine übermäßige Fixierung auf Kennzahlen und Scores kann Unsicherheit, Kontrollverhalten und im Fall des Schlaftrackings sogar orthosomnische Tendenzen fördern.


Literatur:

Allied Market Research. (2023). Smartwatch market size and industry forecast. Abgerufen am 14.03.2026 unter
https://www.alliedmarketresearch.com/smartwatch-market

Baron, K. G., Abbott, S., Jao, N., Manalo, N., & Mullen, R. (2017). Orthosomnia: Are some patients taking the quantified self too far? Journal of Clinical Sleep Medicine, 13(2), 351–354. https://doi.org/10.5664/jcsm.6472

Carrier, B., Creer, A., Williams, L. R., Holmes, T. M., Jolley, B. D., Dahl, S., Weber, E., & Standifird, T. (2020). Validation of Garmin fēnix 3 HR fitness tracker biomechanics and metabolics (VO₂max). Journal for the Measurement of Physical Behaviour, 3(4), 331–337. https://doi.org/10.1123/jmpb.2019-0066

Carrier, B., Marten Chaves, S., & Navalta, J. W. (2025). Validation of aerobic capacity (VO₂max) and pulse oximetry in wearable technology. Sensors, 25(1), 275. https://doi.org/10.3390/s25010275

Dial, M. B., Hollander, M. E., Vatne, E. A., Emerson, A. M., Edwards, N. A., & Hagen, J. A. (2025). Validation of nocturnal resting heart rate and heart rate variability in consumer wearables. Physiological Reports, 13(16), e70527. https://doi.org/10.14814/phy2.70527

ElectroIQ. (2025). Smartwatch statistics: Global users and growth. Abgerufen am 14.03.2026 unter
https://electroiq.com/stats/smartwatch-statistics/

Engel, F. A., Masur, L., Sperlich, B., et al. (2026). Validity of V̇O₂max estimates from the Forerunner 245 smartwatch in highly vs. moderately trained endurance athletes. European Journal of Applied Physiology, 126(1), 591–603. https://doi.org/10.1007/s00421-025-05923-x

Fortune Business Insights. (2025). Smartwatch market size & industry growth. Abgerufen am 14.03.2026 unter
https://www.fortunebusinessinsights.com/smartwatch-market-106625

Grand View Research. (2022). Smartwatch market size report. Abgerufen am 14.03.2026 unter
https://www.grandviewresearch.com/industry-analysis/smartwatches-market

Hernandez, R. (2025). Resting heart rate variability measured by consumer wearables and its associations with diverse health domains in five longitudinal studies. Sensors, 25(23), 7147. https://doi.org/10.3390/s25237147

Hernando, D., Roca, S., Sancho, J., Alesanco, Á., & Bailón, R. (2023). Accuracy assessment of Oura Ring nocturnal heart rate and heart rate variability compared with electrocardiography in time and frequency domains. Journal of Medical Internet Research, 24(1), e27487. https://doi.org/10.2196/27487

Jahrami, H., Fekih-Romdhane, F., Saif, Z. Q., et al. (2024). Prevalence of orthosomnia in a general population sample: A cross-sectional study. Brain Sciences, 14(11), 1123. https://doi.org/10.3390/brainsci14111123

Market.us. (2026). Smartwatch statistics and user growth. Abgerufen am 14.03.2026 unter
https://market.us/report/smartwatch-market/

Miller, D. J., Sargent, C., & Roach, G. D. (2022). A validation of six wearable devices for estimating sleep, heart rate and heart rate variability in healthy adults. Sensors, 22(16), 6317. https://doi.org/10.3390/s22166317

Passler, S., Bohrer, J., Blöchinger, L., & Senner, V. (2019). Validity of wrist-worn activity trackers for estimating VO₂max and energy expenditure. International Journal of Environmental Research and Public Health, 16(17), 3037. https://doi.org/10.3390/ijerph16173037

Polar. (o. J.). Polar’s history of heart rate monitoring innovation. Abgerufen am 14.03.2026 unter
https://www.polar.com/blog/40-years-of-incredible-firsts-polar-history/

Schyvens, A.-M., et al. (2025). A performance validation of six commercial wrist-worn wearable sleep-tracking devices for sleep stage scoring compared to polysomnography. Sleep Advances, 6(2), zpaf021. https://doi.org/10.1093/sleepadvances/zpaf021

Stiftung Warentest. (2024). Smartwatches: Uhren täuschen Blutzucker-Messung vor. Abgerufen am 14.03.2026 unter
https://www.test.de/Smartwatches-Uhren-taeuschen-Blutzucker-Messung-vor-6124003-0

Svensson, T., et al. (2024). Validity and reliability of the Oura Ring Generation 3 (Gen3) with Oura sleep staging algorithm 2.0 compared to multi-night ambulatory polysomnography. Sleep Medicine, 115, 251–263. https://doi.org/10.1016/j.sleep.2024.01.020

Theurl, F., Schreinlechner, M., Sappler, N., Toifl, M., Dolejsi, T., Hofer, F., … & Bauer, A. (2023). Smartwatch-derived heart rate variability: A head-to-head comparison with the gold standard in cardiovascular disease. European Heart Journal – Digital Health, 4(3), 155–164. https://doi.org/10.1093/ehjdh/ztad022

World Bank. (o. J.). Population, total. Abgerufen am 14.03.2026 unter
https://data.worldbank.org/indicator/SP.POP.TOTL

Železnik Mežan, L., et al. (2025). Accuracy of wearables for determining the maximal oxygen uptake and lactate threshold: a qualitative systematic review. Frontiers in Sports and Active Living. https://doi.org/10.3389/fspor.2025.1707991

Artikel zuletzt aktualisiert: 23. März 2026

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert