Wer meinen Blog aufmerksam verfolgt der wird festgestellt haben, dass ich versuche auf Grundlage wissenschaftlicher Fakten und evidenzbasiert (anhand von Eigenstudien) die Themen Gesundheit und Fitness zu untersuchen.
Seit etwas mehr als drei Wochen mache ich eine sogenannte „90-Tages-Challenge“. Alle Details zu diesem Thema könnt ihr hier und in den Posts zum Thema, die beinahe täglich erscheinen nachlesen.
Bereits vor Beginn der Challenge habe ich angefangen mein tägliches Leben so auszurichten, dass mein Körper vermehrt zur Autophagie neigt. Alles weitere dazu findet ihr hier, hier, hier, hier und vor allem hier und hier).
Seit mehreren Jahren dokumentiere ich mein gesamtes Leben anhand von Tagebucheinträgen und in Form der Erhebung so vieler Parameter wie möglich. Ziel ist es mögliche gesundheitliche Probleme früh genug zu erkennen und Fehlentwicklungen in der Lebensführung rechtzeitig entgegen zu wirken.
Aus diesem Grunde habe ich z.B. eine Smart-Watch(vivoactive HR von Garmin) und eine Ganzkörper-Analysewaage (KaradaScan BF511 von Omron) angeschafft.
Sicherlich sind dies nicht die präzisesten Werkzeuge, aber sie helfen dabei sukzessiv Besonderheiten aufzudecken. Außerdem bin ich, obwohl ich gewiss kein Mathemagier bin, sehr fasziniert von Zahlen und Daten und spiele einfach sehr gerne mit diesen rum.
Worum es mir in diesem Artikel jetzt gehen soll ist eine Beobachtung, die ich diese Woche gemacht habe.
Häufig kommen Leute auf mich zu so nach dem Motto: „Sport bringt doch eh nix!“ Oder „Es ist doch egal wie man isst oder lebt, der Körper wird’s schon richten!“.
Das Problem ist meiner Meinung nach, dass die Leute die Auswirkungen vom Fehlverhalten nicht direkt bemerken. Wie ihr vielleicht bereits aus meinen Artikeln entnehmen konntet zeigen sich die Effekte von gesunder Ernährung und Sport, sowie eben das Gegenteil davon, oft erst nach Jahren.
Doch auch über kurze Sicht kann man bereits viel „herauslesen“.
Diese Woche habe ich etwas Verblüffendes festgestellt und darum soll es heute gehen.
Ich stellte nämlich fest, dass sich mein Puls während der Challenge in bemerkenswerter Art und Weise stabilisiert hat. In der folgenden Abbildung seht ihr meinen Puls an 27 Tagen vor Beginn und an 27 Tagen nach Beginn der Challenge.
Abb. 1: Ruhepuls (Tagesmittelwert) vor und nach Beginn der Challenge.
Es ist ein eindeutiger Trend zu einem niedrigeren und konstanteren Ruhepuls erkennbar.
Um aber zu sehen ob dies tatsächlich so ist, habe ich eine statistische Auswertung davon vorgenommen wie ihr in der folgenden Abbildung sehen könnt.
Abb.2 Statistische Auswertung meines Ruhepuls. Gezeigt ist der Mittelwert ± Standardfehler, sowie die Ergebnisse der Einzelmessungen. Als statistischer Test wurde ein gepaarter Student’s t-Test (two-tailed) vorgenommen. A. Alle Werte vor und nach Beginn der Challenge im Vergleich. Der rote Messpunkt zeigt den ersten Tag der Challenge. B. Datensatz vor und nach Beginn der Challenge wurde nochmals aufgeteilt in erste und zweite Hälfte.
Wie ihr in der obigen Abbildung (Abb.2A) sehen könnt ist eine „statistische Signifikanz“ im Unterschied meines Ruhepuls vor und nach Beginn der Challenge vorhanden. Der P-Wert (wir werden im nächsten Artikel über CRM & Telomere noch näher darauf eingehen) sagt in diesem Fall lediglich aus wie sinnvoll es ist nach einem solchen Ergebnis weiter daran zu arbeiten. Je kleiner der P-Wert, desto „wahrscheinlicher“ (Gänsefüßchen sind bewusst gesetzt) ist es, dass man bei Fortführung der Versuchsreihe nicht komplett seine Zeit verschwendet.
Es ist aber schon in Abb.1 zu sehen, dass bereits vor der Challenge sehr starke Schwankungen vorhanden waren. Das bedeutet, dass Effekte, die nix mit der Challenge zu tun haben uns gegebenenfalls einen Effekt vorgaukeln. Wir also möglicherweise solche Unterschiede gesehen hätten auch wenn ich keine Challenge gemacht hätte.
Um dies zu klären habe ich nun den Stichprobenumfang vor und nach Beginn der Challenge genommen und jeweils in zwei Hälften aufgeteilt. Dies soll es mir ermöglichen periodische Effekte besser zu erkennen. In Abb.2B könnt ihr anhand des P-Wertes ablesen, dass der Unterschied zwischen den beiden Hälften vor Beginn der Challenge prinzipiell „unwahrscheinlicher“ ist als nach Beginn der Challenge (je kleiner der P-Wert, desto besser). Allerdings sind in beiden Fällen die P-Werte sehr klein, weshalb mein Ergebnis durchaus durch normale Schwankungen verursacht worden sein kann.
Für eine weitere Klärung kann man als Kriterium noch die Effektstärke hinzuziehen. Hierzu habe ich mithilfe dieser Webseite hier den sogenannten Cohens d (was das genau ist werden wir vielleicht an anderer Stelle mal beleuchten) berechnet. Mit folgendem Ergebnis:
Tab.1: Effektstärke/Cohens d.
Wie ihr sehen könnt ist die Effektstärke in allen Fällen sehr hoch. Natürlich ist sie bei Vergleich vor und nach Beginn der Challenge wesentlich höher. Die Tatsache, dass aber in jedem Fall ein starker Effekt zu erwarten ist und auch der oben erwähnte P-Wert in allen Fällen sehr niedrig war impliziert, dass die beobachteten Effekte möglicherweise auch durch Zufall verursacht wurden oder nicht derartig stark ins Gewicht fallen könnten, wie man vielleicht erhofft hat.
Neben P-Wert und Effektstärke gibt es aber noch weitere Kriterien, z.B. die sogenannte Bayes’sche Statistik [1]. Letztere bedeutet, dass auch weitere Komponenten wie Vorwissen, Erfahrung etc. in die Bewertung mit einfließen sollten.
In meinem Falle würde man dann zum Beispiel sagen:
„Sport ist gut, gesunde Ernährung ist gut, Verzicht auf Alkohol ist gut, Nichtrauchen ist gut. Das habe ich zwar schon alles vorher so ähnlich gemacht, aber diesmal setze ich eben noch einen oben drauf, deshalb ist klar, dass Schwankungen vorkommen, sie belegen aber eher, dass die Tendenz klar ist, denn unter anderen Umständen wäre die Effekte womöglich noch stärker. Außerdem sieht man einen deutlichen Unterschied.“
Beachtet bitte, dass die Bayes’sche Statistik in Wahrheit ein echt komplexes mathematisches Verfahren ist, wie ihr hier und hier sehen könnt. Ich wollte euch nur mal einen Einblick geben in den Grundgedanken geben.
So wird dann klar, dass Statistik wesentlich komplexer ist und viele Faktoren, Testungen etc. miteinbezieht. Weiterhin kann man sich vorstellen, dass die Bewertungen natürlich auch sehr dehnbar und manipulierbar sind. Einseitiger Verlass auf einen Test (z.B. nur P-Wert) führt daher womöglich häufiger als gedacht zu fehlerhaften Studien [2].
Um die obige Datenlage aber dennoch etwas zu erhärten seien zwei weitere Parameter genannt, ohne jetzt nochmal derart auf diesen rumzuhacken.
In Abb. 3 zu sehen ist die Entwicklung meines Körperfettanteils (Abb.3A) und meiner Muskelmasse (Abb.3B).
Abb.3: Körperfett (A) und Muskelmasse (B) jeweils in kg. Gemessen wurde an verschiedenen Tagen, teilweise aber nicht zur gleichen Tageszeit. Anfangs- und Endpunkt wurden aber zur gleichen Tageszeit unter vergleichbaren Bedingungen erhoben.
Wie ihr sehen könnt habe ich in etwas mehr als drei Wochen etwa 1.4 kg Fett abgenommen und 830 g Muskelmasse zugelegt. Dies würde natürlich eventuell das Pulsergebnis etwas stützen und somit belegen, dass der Effekt „echt“ ist. Es muss aber berücksichtigt werden, dass mein Wiegevorgang nicht exzellent kontrolliert ablief, somit also wissenschaftlichen Kriterien nicht genügen würde. Weiterhin muss erwähnt werden, dass mein Bauchumfang im Wesentlichen seit der letzten Messung konstant blieb. Da ich allerdings sehr dünn bin und verstärkt Bauchmuskulatur ausgebildet haben könnte, hat dieser Parameter für mich womöglich keine besondere Relevanz mehr.
Wir fassen daher zusammen
Durch die Challenge konnte ich meinen Puls stabilisieren und die Herzfrequenz insgesamt vermindern. Dieser Effekt ist zwar „statistisch signifikant“ (wobei man dies auch bestreiten kann) und auch die Effektstärke ist sehr hoch (das ist definitiv so). Allerdings ist dies auch dann der Fall, wenn man Kontrolltestungen vornimmt. Intuitiv (Pseudo-Bayes) betrachtet ergibt sich aber ein eindeutiger Effekt. Die Vergleiche mit der Entwicklung von Körperfett und Muskelmasse liefern weitere Belege für die Echtheit des Effekts. Weiterhin ist zu berücksichtigen, dass ich bereits länger gesund und sportlich lebe und daher Unterschiede nicht mehr derart gravierend auffallen werden, wie etwa bei untrainierten Personen. Eine weitere Erhebung der Daten ist aufgrund der P-Werte sicherlich sinnvoll. Dadurch kann man einem vermeintlichen Effekt weiter nachgehen, sowie mögliche Schwankungen und somit den Zufall gegebenenfalls ausschließen.
Ausblick
Ich werde am Ende der Challenge noch einen ähnlichen Artikel veröffentlichen. Wahrscheinlich vor Weihnachten, wenn ich’s schaffe.
Was bedeuten die Ergebnisse für Euch?
Für euch bedeuten diese Erkenntnisse natürlich, dass jede(r) durch Protokollierung ihrer/seiner Fortschritte und Verhaltensweisen ermessen kann, ob diese oder jene Umstellung etwas für sie/ihn bewirkt. Fortlaufende Optimierung kann somit zu besseren Ergebnissen führen.
Grundlegende Analysen könnt ihr heutzutage schon einfach und bequem erledigen. Ihr braucht nur Excel (oder auch Calc), denn darin könnt ihr bereits einfache t-Tests durchführen. Die Effektstärke könnt ihr mittels der oben genannten Webseite berechnen. Fertig!
Alles also prinzipiell kein Problem.
Um die Frage aus der Überschrift zu beantworten
Ja, Effekte von Ernährung und Sport sind kurzfristig messbar und zeigen auch gewisse „statistische Signifikanzen“. Inwiefern diese der Wahrheit entsprechen muss aber über einen längeren Zeitraum hinweg beobachtet werden. Tests am Anfang geben euch allerdings die Möglichkeit zu sehen ob man auf dem (möglicherweise) „richtigen“ Weg ist.
Einschränkungen dieser „Studie“
- Ich bin kein Statistiker und habe diesen Artikel quasi beim „Frühstücken“ angefertigt.
- Die Messinstrumente sind keine validierten wissenschaftlichen Messinstrumente. Die Messintervalle von Fett und Muskel schwankten außerdem und waren zu verschiedenen Zeiten erhoben worden (Anmerkung: Messung von Anfangs- und Endwert erfolgten zur gleichen Tageszeit).
- Es erfolgte keine Kontrolle durch weitere Personen. Die „Studie“ ist daher durch Subjektivität eingefärbt.
- Weiterhin muss sowas, sofern man dies in einer Fachzeitschrift veröffentlich möchte, zigmal mit anderen Personen und Kontrollgruppen, sowie mehr statistischer Finesse gemacht werden. Dies ist hier natürlich nicht der Fall.
Im letzten Artikel über die Telomere & CR(M) geht es übrigens vermehrt um solche Aspekte. Ich werde aber wahrscheinlich doch noch etwas brauchen, weil nebenher zahlreiche andere Projekte laufen.
Bleibt also dran.
Einen schönen Start in die Woche
Euer Chapper
Quellen
Ich habe mir im Wesentlichen über Jahre hinweg ein paar statistische Kenntnisse angeeignet und dafür viele Quellen aufgesucht. Kürzlich erschien im „Spektrum der Wissenschaft“ eine Publikation mit dem Titel “STATISTIK – Zahlenspiele mit Mehrwert” (Spektrum der Wissenschaft KOMPAKT 2.18). Ich abonniere die Monatsausgabe bereits seit Jahren und kaufe mir auch häufig die Spezialhefte. Gerade diese Ausgabe möchte ich jedem Interessierten wärmstens ans Herz legen. 5,90€ für gute Infos sind meiner Meinung nach echt kein Preis!
Weitere interessante Artikel findet ihr hier:
- Depaoli, S., et al., An introduction to Bayesian statistics in health psychology. Health Psychol Rev, 2017. 11(3): p. 248-264.
- Ioannidis, J.P., Why most published research findings are false. PLoS Med, 2005. 2(8): p. e124.
- Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed). Hillsdale, N.J: L. Erlbaum Associates.