Bizonyítékalapú gyakorlat a személyi edzésben – A bizonyítékok hierarchiája
Megoszt

A bizonyíték-hierarchia az EBP egyik alapkoncepciója. Azt állítja, hogy nem minden bizonyíték egyenlő, és az egyes bizonyítékforrások minősége a bizonyíték típusától függ. A bizonyíték-hierarchia piramisa azt jelzi, hogy a bizonyítékok minősége és a szakemberek által a következtetésekbe vetett bizalom a piramison felfelé haladva növekszik. Más szóval, a piramisban feljebb lévő bizonyítékok megbízhatóbbak, mint az alatta lévő bizonyítékok.
Randomizált kontrollvizsgálatok (Randomised Control Trials – RCT)
Az RCT-t tekintik az „arany standard” vizsgálati tervnek, mivel ez az egyetlen olyan tervtípus, amelyből ok-okozati összefüggésekre lehet következtetni. Az RCT-ben a résztvevőket véletlenszerűen osztják be a csoportokba, így minden személynek egyenlő esélye van arra, hogy valamelyik csoportba bekerüljön. A randomizálási folyamat biztosítja, hogy a két csoport szinte mindenben egyenlő, kivéve a beavatkozást. Például egy vizsgálat, amelynek célja az erőedzés ismétlésszámának az izomnövekedésre gyakorolt hatásának meghatározása, a résztvevők egy csoportját véletlenszerűen osztaná be egy alacsony vagy magas ismétlésszámú csoportba 12 hetes edzés időtartamra. Ennek megfelelően a kutatók megpróbálnának minden más változót a lehető legjobban kontrollálni, hogy azok minimálisan befolyásolják az eredményt. A 12 hét elteltével a kutatók ésszerűen következtethetnének arra, hogy az izomnövekedésben bekövetkezett bármilyen változás a konkrét beavatkozásnak (magas vagy alacsony ismétlésszám) köszönhető. Az izomnövekedésben mutatkozó különbségeket nem lehetett a genetikának, a motivációnak vagy az étrendnek tulajdonítani, mivel a randomizálás biztosította, hogy ezek a változók egyenlően oszlottak meg mindkét csoportban.

Metaanalízis
A metaanalízis általában a bizonyítékok legmagasabb formájának tekinthető, és a piramis csúcsát foglalja el. A metaanalízis szintetizálja az adott témával kapcsolatos összes RCT-t, és statisztikai módszerekk segítségével számszerűsíti az összes vizsgálat eredményeit. A metaanalízis legnagyobb előnye – amellett, hogy egyetlen becslést ad az összes tanulmány eredményéről –, hogy a bizonyítékok összességét vizsgálja, ahelyett, hogy szelektíven azonosítaná (vagy önkényesen kiválasztaná) azokat a tanulmányokat, amelyek megfelelnek egy narratívának. A metaanalízisek fontosak lehetnek a testmozgással és táplálkozással kapcsolatos témák esetében is, mivel az egyes kutatások mintáinak mérete gyakran alacsony, és így a tanulmányok adatainak összevonása nagyobb statisztikai erőt biztosít a következtetések levonásához.
Megfigyeléses vizsgálatok
Megfigyeléses vizsgálatokat gyakran akkor végeznek, ha az RCT pénzügyi vagy gyakorlati korlátok miatt nem kivitelezhető. Például 5–10 évig tartó RCT-t végezni olyan kimenetek vizsgálatára, mint a halálozás, szívbetegség vagy rák, nem biztos, hogy megvalósítható. Az RCT-k etikátlanok az olyan ártalmakat vizsgáló tanulmányok esetében is, mint például a dohányzás. A megfigyeléses vizsgálatok a résztvevők megfigyelését foglalják magukban anélkül, hogy a résztvevőket véletlenszerűen csoportokba sorolnák vagy beavatkozást írnának elő. Az olyan vizsgálati terveket, mint az esettanulmány vagy kohorszvizsgálatok, a „megfigyeléses vizsgálatok” közé sorolják.
Egy megfigyeléses vizsgálat például a vörös hús fogyasztásának a szív- és érrendszeri betegségek (CVD: cardiovascular disease) és a halálozás kockázatára gyakorolt hatását vizsgálja. Mivel a CVD vagy a CVD okozta halálozás kialakulásához évek kellenek, egy RCT elvégzése gyakran nem kivitelezhető. Emellett etikátlan lenne arra utasítani a résztvevőket, hogy éveken át egyenek vörös húst, hogy felmérjék, kialakul-e náluk CVD, ha okkal feltételezhető, hogy valóban létezik összefüggés. Ezért a megfigyeléses vizsgálat lehetővé teszi a kutatók számára, hogy tanulmányozzák a már vörös húst fogyasztó embereket, és összehasonlítsák őket azokkal, akik nem esznek vörös húst. Mivel nincs véletlenszerűség, a csoportok életmódjuk, gyógyszerezésük, szokásaik, genetikájuk stb. tekintetében különbözhetnek egymástól. Például a vörös húst kerülő emberek egészségtudatosabbak és fizikailag aktívabbak lehetnek, esetleg dohányoznak és kevesebb alkoholt fogyasztanak (Mihrshahi et al., 2017; Orlich et al., 2013). Ezért nem lehet megállapítani, hogy a szívbetegségek megfigyelt növekedését a vörös hús fogyasztása vagy az egészségtelen életmód okozta-e. A kutatásban ezeket a nem kontrollált változókat zavaró tényezőknek vagy kovariánsoknak nevezik. Bár a zavaró tényezőket a statisztikai elemzés során figyelembe veszik, a megfigyeléses vizsgálatok csak összefüggéseket tudnak kimutatni, ok-okozati összefüggést nem. Laikus nyelven szólva az „asszociáció” azt jelenti, hogy nem lehet biztosra venni, hogy a vörös hús ok-okozati szerepet játszott-e a szívbetegségben.

In vitro / állatkísérletek
Az in vitro („üvegben”) azt jelenti, hogy az élő szervezeten kívül, például kémcsőben vagy Petri-csészében. Az állatkísérletekben rágcsálókat és majmokat használnak modellként, mivel vannak bizonyos hasonlóságuk az emberrel. Vannak azonban feltűnő eltérések is. Az állati modellek megbízhatatlanságát egy ismert idézet is érzékelteti: „Az egerek hazudnak, a majmok pedig túlzásokba esnek”. A gyógyszerkutatásban gyakran alkalmaznak laboratóriumi vizsgálatokat és állatkísérleteket, de ezeket mindig humán vizsgálatok követik, amelyeket gyakran 1., 2. és 3. fázisú vizsgálatoknak neveznek. Az in vitro / állatkísérleteket általában előzetes vagy preklinikai bizonyítékként használják, hogy hipotéziseket állítsanak fel, amelyek további, embereken végzett megerősítő kutatásokat igényelnek.
Szakértői vélemény / tapasztalat
A szakértői vélemény vagy tapasztalat gyakran tévedhet, amint azt az előző példák is mutatták, ezért a hierarchia legalsó pozícióját foglalja el. A bizonyítékok hierarchiájával kapcsolatban három fontos szempontot kell szem előtt tartani.
- Először is, a hierarchia csúcsa felé haladva nő a megbízhatóság vagy a vizsgálati eredményekbe vetett bizalom, és csökken a torzítás (az igazságtól való módszeres eltérés). Így a metaanalízis vagy az RCT-k szisztematikus áttekintése a bizonyítékok legmagasabb formája, a legkisebb torzítással.
- Másodszor, a hierarchia nem kőbe vésett és nem statikus; a vizsgálat minőségétől függően egy RCT a hierarchiában visszaminősíthető. Hasonlóképpen a megfigyelési tanulmányok is feljebb sorolhatók. Következésképpen fontos a tanulmány módszertana.
- Harmadszor, mindig van bizonyíték. Ezért a legjobb bizonyíték az, ami aktuálisan rendelkezésre áll, és nem feltétlenül kell RCT-ből vagy metaanalízisből származnia ahhoz, hogy a szakemberek cselekedjenek. Az ajánlások azonban a bizonyítékok típusától és megbízhatóságától függően változnak. Ha a szakemberek csak szakértői véleménnyel rendelkezhetnek, akkor nem szabad biztosnak lenniük a bizonyítékokban, és el kell ismerniük ezt a bizonytalanságot, amikor ajánlásokat tesznek a klienseknek.
Egy tanulmány kritikai értékelése
Az EBP alapelveinek általános megértése után elengedhetetlen a tanulmányok megértéséhez és értékeléséhez szükséges készségek fejlesztése. Tapasztalataink szerint a legtöbb ember gyorsan következtetéseket von le, mielőtt tisztában lenne az adott tanulmány főbb részeivel. Ezért a gyakorlati szakembereknek azt tanácsoljuk, hogy kövessék a PICO keretrendszert egy RCT meghatározásához és megértéséhez (Sackett, 1997).
- Népesség (minta) (P – population): A vizsgált konkrét egyénekre vagy közösségre vonatkozik (azaz a vizsgálatban résztvevők leíró jellemzőire). A kutatás nagyon populációspecifikus. Például, ha egy gyakorlat, vagy étrend-kiegészítő edzett egyéneknél működik, nem biztos, hogy hatással van az edzetlen egyénekre.
- Beavatkozás (I – intervention): A vizsgált dolog konkrét fókuszára utal. A beavatkozás lehet ellenállásos edzés, étrend-kiegészítő, pszichológiai terápia stb. Megfigyelési vizsgálatban nincs kijelölt beavatkozás, ezért az „I” helyett „E” (expozíció) szerepel. Az is fontos, hogy megértsük a beavatkozás sajátosságait. Egy edzésintervenció esetében a konkrét részletek (pl. gyakoriság, intenzitás, terjedelem, időtartam) általában hatással vannak az eredményekre és a következtetésekre. Például egy 10 hetes beavatkozásnak más eredményei lehetnek, mint egy hasonló, 6 hónapig tartó beavatkozásnak.
- Kontrollcsoport (C – comparator group): Az(ok) a csoport(ok), amellyel a beavatkozási csoportot összehasonlítják. Egy vizsgálat értelmezésekor figyelembe kell venni a kontrollcsoportot, hogy elkerülhető legyen a félrevezető következtetés levonása. Például egy új mozgásintervenció látványosnak tűnhet, ha egy ülőmunkát végző résztvevőkből álló kontrollcsoporttal (beavatkozás nélküli csoporttal) hasonlítják össze. Az eredmények azonban középszerűek lehetnek, ha az összehasonlító csoport egy standard edzésprotokollt végez.
- Eredmény(ek) (O – outcome): A vizsgálat elsődleges kimenetelére (kimeneteire) vagy végpontjára (végpontjaira) utal. Az edzéssel foglalkozó kutatásokban ez lehet maximális erő, izomhipertrófia vagy a teljesítmény mérése, például időmérés vagy maximális oxigénfelvevő képesség (VO2max). A kiválasztott eredménynek jelenősnek és érvényesnek kell lennie.
A PICO azonosítása lehetővé teszi az olvasó számára, hogy gyorsan megértse a vizsgálatot. Az alábbi példa egy hipotetikus vizsgálat PICO-keretét vázolja fel.
- Népesség: 18–26 éves ülő életmódot folytató nők, átlagosan 22,0 BMI-vel;
- Intervenció: Magas intenzitású intervall edzés (HIIT) heti 3 napon át 12 héten keresztül kerékpár-ergométeren;
- Kontrollcsoport: ülő életmódot folytató nők;
- Eredmény(ek): A testzsír változása (bőrredő kaliperrel mérve).
A PICO-kérdés: „Csökkentheti-e 12 hetes magas intenzitású intervall edzés a testzsírt fiatal, ülőéletmódot folytató nőknél egy ülő életmódú kontrollcsoporthoz képest?” A PICO megállapításával nyilvánvalóvá válik a vizsgálat néhány limitációja: Az egészséges BMI-vel rendelkező nők populációja azt jelenti, hogy az eredmények nem extrapolálhatók sem a férfiakra, sem az elhízott felnőttekre. Emellett a vizsgálat csak az ülőéletmódot folytató (edzés nélküli) csoporthoz képest mutatott ki változásokat, ezért nem világos, hogy a HIIT-nek volt-e ok-okozati szerepe. Annak megállapításához, hogy a HIIT volt felelős a testzsír változásáért, a vizsgálatnak olyan kontrollcsoportot kellett volna használnia, amely egy standard, közepes intenzitású, tartós módszerű edzésprotokollt végzett. A vizsgált eredmények a testösszetételt bőrredő kaliper segítségével értékelték, ami kisebb pontosságot kínál, mint más mérési módszerek (pl. DEXA). Összefoglalva, a PICO-hoz hasonló szisztematikus megközelítés alkalmazása lehetővé teszi az olvasó számára, hogy gyorsan összegyűjtse a tanulmány lényegét, és feltárja a tanulmány erősségeit és korlátait.

A vizsgálat eredményeinek értékelése
Egy vizsgálat eredményeinek vagy kimeneteleinek elemzésekor négy elsődleges fogalmat kell figyelembe venni:
- Helyettesítő eredmények: Az eredmény helyettesítő vagy kicserélhető? A helyettesítő eredmények olyan kimenetelek a tudományos vizsgálatokban, amelyek csupán laboratóriumi/élettani markerek a klinikailag jelentős eredmények esetén (vagy olyan eredmények, amik a kutatókat érdeklik). Például az idősebb felnőtteket kevésbé érdekli az izomtömeg vagy a fekvenyomás közben kifejtett erő, hanem inkább az, hogy képesek-e mindennapi tevékenységeket végezni, például lépcsőzni. A testépítőket az EMG-aktivitás, a fehérjeszintézis vagy a molekuláris jelátviteli útvonalak helyett az izomméret és a testzsír érdekli. A helyettesítő eredményeket használó vizsgálatok általában előzetes adatokkal szolgálnak, vagy hipotéziseket állítanak fel a koncepciót bizonyító vizsgálatokhoz. Ezért a kutatók kevésbé bíznak abban, hogy a helyettesítő eredmények alapján gyakorlati ajánlásokat tegyenek.
- Statisztikai szignifikancia: A statisztikai szignifikancia azt a kérdést teszi fel, hogy „A vizsgálati eredmények csak a véletlen művei?”. Általában a legtöbb kutatási területen a P (probability) valószínűségi érték határértéke 0,05. Így, ha a P-érték, amelyet általában az absztraktban/eredményekben/ábrákban közölnek, kisebb, mint 0,05 (5%), az eredményt „statisztikailag szignifikánsnak” tekintik. Ez azt jelenti, hogy 5%-nál kisebb az esélye annak, hogy a kapott eredmények a véletlenszerűséggel magyarázhatók. Például, ha a P-érték 0,03, az eredmény statisztikailag szignifikáns. A statisztikai következtetés azonban összetett téma, és számos kérdés merült fel a P-értékek adott szignifikanciaszinten történő használatával szemben (Wasserstein & Lazar, 2016). A gyakorlati következtetések levonásához pontbecslések és konfidenciaintervallumok használatát javasoljuk (Amrhein et al., 2019), de ez a téma meghaladja e fejezet kereteit.
- Klinikai szignifikancia: Ha a statisztikai szignifikancia azt a kérdést teszi fel, hogy „van-e különbség?”, a klinikai szignifikancia azt kérdezi, hogy „mekkora a különbség?”. Jellemzően a kimenetelben bekövetkezett változás nagyságrendje az eredmények részben található táblázatokból vagy ábrákból állapítható meg. Elméletileg elég nagy mintanagyság esetén akár a testsúly 0,5 kg-os csökkenése is statisztikailag szignifikáns lehet. Ezért kulcsfontosságú megérteni, hogy a statisztikailag szignifikáns nem jelenti azt, hogy az eredmények a gyakorlatban jelentősek. Ezért mind a statisztikai, mind a gyakorlati szignifikanciát külön-külön kell vizsgálni. A testsúlycsökkentéssel kapcsolatos szakirodalomban a kezdeti testsúly 5–7 %-os csökkenését tekintik a gyakorlatban jelentősnek. A testmozgástudományban a kutatás bizonytalan az izomnövekedés vagy zsírvesztés gyakorlati jelentőségét illetően a teljesítmény vagy esztétikai célok szempontjából. Például az izomtömeg egy hónap alatti 1 kg-os növekedése egy kezdő számára látszólag jelentősnek tűnik; az ilyen mértékű növekedés azonban szinte észrevehetetlen egy edzett egyén számára.
- Kedvezőtlen hatások/költségek/terhek: Az általunk tapasztaltak alapján az emberek gyakran kevesebb figyelmet fordítanak a beavatkozás káros hatásaira, gazdasági költségeire és terheire vagy kellemetlenségeire. Bár a testmozgás káros hatásai a farmakológiai / gyógyszeres kezelésekhez képest nem feltétlenül életveszélyesek, klinikai populációk, idősebb felnőttek és terhes nők esetében jelentősek lehetnek. A gazdasági költségek jelentős aggodalomra adnak okot, amelyet gyakran figyelmen kívül hagynak, különösen az étrend-kiegészítők vagy a speciális étrendek (pl. bioélelmiszerek ajánlása) értékelésekor. A korlátozott anyagi lehetőségekkel rendelkező emberek esetében a költségek jelentős aggodalomra adnak okot, amit figyelembe kell venni. A beavatkozás terhét is fel kell mérni, mivel még a látszólag kis feladatok, mint például egy napi tabletta bevétele is járnak kellemetlenségekkel. Az olyan edzésprogramok, mint a CrossFit®, a nagy gyakorisággal végzett edzés vagy a haladó technikákat alkalmazó programok (lásd a 13. fejezetet) rendkívül fárasztóak és megterhelőek lehetnek. Ezért minden edzőnek fel kell tennie a kérdést, hogy a beavatkozás/étrend-kiegészítő előnyei megéri-e a kockázatokat, az ártalmakat, a terhetket és a költségeket.
A tanulmányok minőségének értékelése
A tudományos tanulmányok kritikus elemzése a minőségük (vagy megbízhatóságuk) értékelése érdekében az EBP egyik alapvető eleme. A bizonyítékok kritikus értékelésénél három minőségi szint kijelölését javasoljuk: alacsony, közepes és magas. Bár egy RCT kiváló minőségű osztályzattal indul, a korlátoktól függően közepesre vagy alacsonyra lehet visszaminősíteni. Egy leminősített RCT azt jelenti, hogy bizonytalanság van az eredmények megbízhatóságát illetően. A megfigyeléses tanulmányok vagy nem szisztematikus megfigyelések és esetsorozatok mindig alacsony minőségű bizonyítéknak számítanak, de a megfigyeléses tanulmányok feljebb minősíthetők. Számos tényező csökkenti az RCT minőségét, például a véletlenszerű elosztás hiánya, a csoportba sorolás vakságának a hiánya, a vizsgálati alanyok nagymértékű kiesése, a nem megfelelő kontrollcsoport, a kis mintanagyság miatti alacsony pontosság, a beavatkozás/populáció közvetlensége és a helyettesítő kimenetelek.
A bizonyítékoktól az ajánlásokig
A tanulmány kritikus értékelése után a kliensnek tanácsot lehet adni, hogy milyen lépéseket tegyen. A kliensek elvárják és értékelik az útmutatást, ezért az edzőnek ajánlást kell adnia, még akkor is, ha a bizonyítékok hiányosak, ellentmondásosak vagy hiányoznak. Számos hivatalos iránymutatást dolgoztak ki a bizonyítékoktól az ajánlásig való szisztematikus és átlátható elmozdulás érdekében. Az egyik ilyen megközelítés a GRADE (Grading of Recommendations, Assessment, Development and Evaluation) nemzetközi rendszer (Guyatt et al., 2008, 2009), amelyet széles körben alkalmaznak az irányelvek kidolgozásához. A GRADE az ajánlásokat erősnek vagy gyengének minősíti az előnyök, a kockázat, a teher / megterhelés és a költségek közötti kompromisszum függvényében:
- Erős ajánlás (mellette/ellene) akkor készül, ha a szakember nagyon- vagy rendkívül biztos abban, hogy az előnyök meghaladják az ártalmakat, a költségeket és a terheket, vagy fordítva.
- Gyenge/feltételes ajánlás (mellette/ellene) akkor készül, ha jelentős bizonytalanság áll fenn, vagy ha az előnyök és kockázatok kényes egyensúlyban vannak.
Forrás: Anoop T. Balachandran és Brad J. Schoenfeld írása (részlet a Személyi edzés haladóknak című könyvből)
Kövess minket itt is, ott is!