Bakteriaalne infektsioon, kui see tungib. Bakteriaalne infektsioon - sümptomid, diagnoos ja ravi
Enamiku lihtsate mõõtmiste puhul on nn juhuslike vigade tavaseadus üsna hästi täidetud ( Gaussi seadus), mis tuleneb järgmistest empiirilistest sätetest.
1) mõõtmisvead võivad võtta pideva väärtuste jada;
2) suure hulga mõõtmistega, samas suurusjärgus vead, kuid erinev märk esinevad võrdselt sageli
3) mida suurem on juhuslik viga, seda vähem tõenäoline tema välimus.
Gaussi normaaljaotuse graafik on näidatud joonisel 1. Kõvera võrrandil on vorm
kus on juhuslike vigade (vigade) jaotusfunktsioon, mis iseloomustab vea tõenäosust, σ on ruutkeskmine viga.
Väärtus σ ei ole juhuslik suurus ja iseloomustab mõõtmisprotsessi. Kui mõõtmistingimused ei muutu, siis σ jääb konstantseks. Selle suuruse ruutu nimetatakse mõõtmiste hajutamine. Mida väiksem on dispersioon, seda väiksem on üksikute väärtuste levik ja seda suurem on mõõtmise täpsus.
Ruutkeskmise vea σ täpne väärtus, samuti mõõdetud suuruse tegelik väärtus, pole teada. On olemas nn statistiline hindamine selle parameetri kohta, mille kohaselt ruutkeskmine viga on võrdne aritmeetilise keskmise ruutkeskmise veaga. Mille väärtus määratakse valemiga
kus on tulemus i-th mõõde; - saadud väärtuste aritmeetiline keskmine; n on mõõtmiste arv.
Mida suurem on mõõtmiste arv, seda väiksem ja rohkem see läheneb σ-le. Kui mõõdetud suuruse μ tegelik väärtus, selle mõõtmiste tulemusel saadud aritmeetiline keskmine väärtus ja juhuslik absoluutviga , siis kirjutatakse mõõtmistulemus kujul .
Väärtuste intervalli vahemikus kuni , millesse mõõdetud suuruse μ tegelik väärtus langeb, nimetatakse usaldusvahemik. Kuna tegemist on juhusliku muutujaga, langeb tegelik väärtus tõenäosusega α usaldusvahemikku, mida nimetatakse usalduse tõenäosus, või usaldusväärsus mõõdud. See väärtus on arvuliselt võrdne varjutatud kõverjoonelise trapetsi pindalaga. (vaata pilti.)
Kõik see kehtib piisavalt suure arvu mõõtmiste kohta, kui see on σ lähedal. Usaldusvahemiku ja usaldusnivoo leidmiseks väikese arvu mõõtmiste jaoks, millega me teostamise ajal tegeleme laboritööd, kasutatud Õpilase tõenäosusjaotus. See on tõenäosusjaotus juhuslik muutuja helistas Üliõpilaste koefitsient, annab usaldusvahemiku väärtuse aritmeetilise keskmise ruutkeskmise vea murdosades.
Selle suuruse tõenäosusjaotus ei sõltu σ 2-st, vaid sõltub sisuliselt katsete arvust n. Eksperimentide arvu suurenemisega n Studenti jaotus kaldub Gaussi jaotusele.
Jaotusfunktsioon on tabelina (tabel 1). Studenti koefitsiendi väärtus on mõõtmiste arvule vastava sirge lõikepunktis n ja veerg, mis vastab usaldustasemele α
Sageli peab hindaja analüüsima selle segmendi kinnisvaraturgu, kus hindamisobjekt asub. Kui turg on arenenud, võib kogu esitatud objektide komplekti analüüsimine olla keeruline, seetõttu kasutatakse analüüsimiseks objektide valimit. See valim ei ole alati homogeenne, mõnikord tuleb see puhastada äärmustest - liiga kõrgetest või liiga madalatest turupakkumistest. Sel eesmärgil rakendatakse seda usaldusvahemik. Sihtmärk see uuring- viia läbi kahe usaldusvahemiku arvutamise meetodi võrdlev analüüs ja valida parim variant arvutus erinevate valimitega töötamisel süsteemis estimatica.pro.
Usaldusvahemik - arvutatakse valimi põhjal, tunnuse väärtuste intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi hinnangulist parameetrit.
Usaldusvahemiku arvutamise mõte on koostada selline intervall näidisandmete põhjal, et saaks etteantud tõenäosusega väita, et hinnangulise parameetri väärtus on selles intervallis. Teisisõnu sisaldab teatud tõenäosusega usaldusvahemik hinnangulise suuruse tundmatut väärtust. Mida laiem on intervall, seda suurem on ebatäpsus.
Usaldusvahemiku määramiseks on erinevaid meetodeid. Selles artiklis käsitleme kahte võimalust:
- läbi mediaani ja standardhälbe;
- läbi t-statistika kriitilise väärtuse (Studendi koefitsient).
Etapid võrdlev analüüs erinevatel viisidel CI arvutus:
1. moodustada andmeproov;
2. töötle seda statistilised meetodid: arvutage keskmine, mediaan, dispersioon jne;
3. arvutame usaldusvahemiku kahel viisil;
4. Analüüsige puhastatud proove ja saadud usaldusvahemikke.
1. etapp. Andmete valim
Valim moodustati süsteemi estimatica.pro abil. Valimisse kuulus 91 pakkumist 3. hinnatsooni 1-toaliste korterite müügiks planeeringuga "Hruštšov".
Tabel 1. Esialgne valim
Hind 1 ruutmeetrit, c.u. |
|
Joonis 1. Esialgne proov
2. etapp. Algproovi töötlemine
Proovide töötlemine statistiliste meetoditega nõuab järgmiste väärtuste arvutamist:
1. Aritmeetiline keskmine
2. Mediaan - valimit iseloomustav arv: täpselt pooled valimi elemendid on mediaanist suuremad, teine pool on mediaanist väiksemad
(paaritu arvu väärtustega proovi jaoks)
3. Vahemik - erinevus proovi maksimaalsete ja minimaalsete väärtuste vahel
4. Dispersioon – kasutatakse andmete varieerumise täpsemaks hindamiseks
5. Valimi standardhälve (edaspidi RSD) on kõige levinum näitaja, mis näitab korrigeerimisväärtuste hajumist aritmeetilise keskmise ümber.
6. Variatsioonikoefitsient – peegeldab korrigeerimisväärtuste hajumise astet
7. võnkekoefitsient – peegeldab valimi hindade äärmuslike väärtuste suhtelist kõikumist keskmise ümber
Tabel 2. Statistilised näitajad originaalproov
Andmete homogeensust iseloomustav variatsioonikordaja on 12,29%, kuid võnketegur on liiga suur. Seega võime väita, et esialgne valim ei ole homogeenne, seega liigume edasi usaldusvahemiku arvutamise juurde.
3. etapp. Usaldusvahemiku arvutamine
Meetod 1. Arvutamine läbi mediaani ja standardhälbe.
Usaldusvahemik määratakse järgmiselt: minimaalne väärtus - standardhälve lahutatakse mediaanist; maksimaalne väärtus – mediaanile lisatakse standardhälve.
Seega usaldusvahemik (47179 CU; 60689 CU)
Riis. 2. Väärtused usaldusvahemikus 1.
Meetod 2. Usaldusvahemiku loomine läbi t-statistika kriitilise väärtuse (õpilase koefitsient)
S.V. Gribovsky raamatus " Matemaatilised meetodid vara väärtuse hindamine” kirjeldab usaldusvahemiku arvutamist läbi Studenti koefitsiendi. Selle meetodiga arvutamisel peab hindaja ise määrama olulisuse taseme ∝, mis määrab usaldusvahemiku koostamise tõenäosuse. Tavaliselt kasutatakse olulisuse tasemeid 0,1; 0,05 ja 0,01. Need vastavad usalduse tõenäosusele 0,9; 0,95 ja 0,99. Selle meetodi puhul eeldatakse tõelised väärtused matemaatiline ootus ja dispersioon on praktiliselt tundmatud (mis praktiliste hindamisülesannete lahendamisel on peaaegu alati tõsi).
Usaldusvahemiku valem:
n - valimi suurus;
t-statistika (Studendi jaotused) kriitiline väärtus olulisuse tasemega ∝, vabadusastmete arv n-1, mis määratakse spetsiaalsete statistiliste tabelitega või MS Exceli abil (→"Statistiline"→ STUDRASPOBR);
∝ - olulisuse tase, võtame ∝=0,01.
Riis. 2. Väärtused usaldusvahemikus 2.
Etapp 4. Usaldusvahemiku arvutamise erinevate võimaluste analüüs
Usaldusvahemiku arvutamiseks viisid kaks võimalust – läbi mediaani ja Studenti koefitsiendi erinevad väärtused intervallidega. Sellest lähtuvalt saadi kaks erinevat puhastatud proovi.
Tabel 3. Kolme valimi statistilised näitajad.
Indeks |
Esialgne proov |
1 variant |
2. variant |
Keskmine väärtus |
|||
Dispersioon |
|||
Coef. variatsioonid |
|||
Coef. võnkumisi |
|||
Vanade objektide arv, tk. |
Tehtud arvutuste põhjal võib öelda, et erinevaid meetodeid usaldusvahemike väärtused lõikuvad, nii et saate hindaja äranägemisel kasutada mis tahes arvutusmeetodeid.
Siiski usume, et süsteemis estimatica.pro töötades on soovitav valida usaldusvahemiku arvutamise meetod, mis sõltub turu arenguastmest:
- kui turg ei ole arenenud, rakendage mediaani ja standardhälbe kaudu arvutamise meetodit, kuna kasutuselt kõrvaldatud objektide arv on sel juhul väike;
- kui turg on arenenud, rakenda arvutust läbi t-statistika kriitilise väärtuse (Studendi koefitsient), kuna on võimalik moodustada suur algvalim.
Artikli ettevalmistamisel kasutati:
1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matemaatilised meetodid vara väärtuse hindamiseks. Moskva, 2014
2. Andmed süsteemist estimatica.pro
Matemaatilise ootuse usaldusvahemik - see on selline andmetest arvutatud intervall, mis teadaoleva tõenäosusega sisaldab üldkogumi matemaatilist ootust. Matemaatilise ootuse loomulik hinnang on selle vaadeldud väärtuste aritmeetiline keskmine. Seetõttu kasutame tunnis edaspidi mõisteid "keskmine", "keskmine väärtus". Usaldusvahemiku arvutamise ülesannetes nõutakse kõige sagedamini vastust "Keskmise arvu [väärtus konkreetses ülesandes] usaldusvahemik on [madalama väärtuse] kuni [kõrgema väärtuseni]". Usaldusvahemiku abil on võimalik hinnata mitte ainult keskmisi väärtusi, vaid ka ühe või teise tunnuse osakaalu üldkogumis. Keskmised, dispersioon, standardhälve ja viga, mille kaudu jõuame uute definitsioonide ja valemiteni, analüüsitakse tunnis Valimi ja populatsiooni karakteristikud .
Keskmise punkti- ja intervallhinnangud
Kui üldkogumi keskmist väärtust hinnatakse arvu (punkti) abil, siis üldkogumi tundmatu keskmise hinnanguks võetakse vaatluste valimi põhjal arvutatud konkreetne keskmine. Sel juhul ei lange valimi keskmise – juhusliku muutuja – väärtus kokku üldkogumi keskmise väärtusega. Seetõttu on valimi keskmise väärtuse näitamisel vajalik samaaegselt näidata ka valimi viga. Standardviga kasutatakse valimivea mõõduna, mida väljendatakse samades ühikutes kui keskmine. Seetõttu kasutatakse sageli järgmist tähistust: .
Kui keskmise hinnangut nõutakse siduma teatud tõenäosusega, siis huvipakkuva üldkogumi parameetrit tuleb hinnata mitte ühe arvu, vaid intervalli järgi. Usaldusvahemik on intervall, milles teatud tõenäosusega P leitakse üldkogumi hinnangulise näitaja väärtus. Usaldusvahemik, milles tõenäosusega P = 1 - α on juhuslik muutuja , arvutatakse järgmiselt:
,
α = 1 - P, mille võib leida peaaegu iga statistikat käsitleva raamatu lisast.
Praktikas ei ole üldkogumi keskmist ja dispersiooni teada, seega asendatakse üldkogumi dispersioon valimi dispersiooniga ja üldkogumi keskmine valimi keskmisega. Seega arvutatakse usaldusvahemik enamikul juhtudel järgmiselt:
.
Usaldusvahemiku valemit saab kasutada populatsiooni keskmise, kui hinnata
- üldkogumi standardhälve on teada;
- või üldkogumi standardhälve pole teada, kuid valimi suurus on suurem kui 30.
Valimi keskmine on üldkogumi keskmise erapooletu hinnang. Omakorda valimi dispersioon ei ole populatsiooni dispersiooni erapooletu hinnang. Valimi dispersiooni valemi populatsiooni dispersiooni erapooletu hinnangu saamiseks valimi suurus on n tuleks asendada n-1.
Näide 1 Teatud linna 100 juhuslikult valitud kohvikust kogutakse infot, et keskmine töötajate arv neis on 10,5 standardhälbega 4,6. Määrake usaldusvahemik 95% kohviku töötajate arvust.
kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .
Seega jäi kohvikutöötajate keskmise arvu 95% usaldusvahemik 9,6 ja 11,4 vahele.
Näide 2 Juhusliku valimi jaoks 64 vaatlusest koosnevast üldpopulatsioonist arvutati järgmised koguväärtused:
väärtuste summa vaatlustes,
väärtuste keskmisest kõrvalekallete ruudu summa .
Arvutage eeldatava väärtuse 95% usaldusvahemik.
arvutage standardhälve:
,
arvutage keskmine väärtus:
.
Asendage usaldusvahemiku väärtused avaldises:
kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .
Saame:
Seega jäi selle valimi matemaatilise ootuse 95% usaldusvahemik vahemikku 7,484 kuni 11,266.
Näide 3 Juhusliku valimi jaoks 100 vaatlusega üldpopulatsioonist arvutati keskmine väärtus 15,2 ja standardhälve 3,2. Arvutage eeldatava väärtuse 95% usaldusvahemik ja seejärel 99% usaldusvahemik. Kui valimi võimsus ja selle variatsioon jäävad samaks, kuid usaldustegur suureneb, kas siis usaldusvahemik kitseneb või laieneb?
Asendame need väärtused usaldusvahemiku avaldisesse:
kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,05 .
Saame:
.
Seega oli selle valimi keskmise 95% usaldusvahemik 14,57 kuni 15,82.
Jällegi asendame need väärtused usaldusvahemiku avaldisega:
kus on olulisuse taseme standardse normaaljaotuse kriitiline väärtus α = 0,01 .
Saame:
.
Seega oli selle valimi keskmise 99% usaldusvahemik 14,37 kuni 16,02.
Nagu näete, suureneb usalduskoefitsiendi suurenemisega ka standardse normaaljaotuse kriitiline väärtus ja sellest tulenevalt alg- ja lõpp-punkt intervallid on keskmisest kaugemal ja seega suureneb eeldatava väärtuse usaldusvahemik.
Erikaalu punkt- ja intervallhinnangud
Valimi mõne tunnuse osakaalu võib tõlgendada osakaalu punkthinnanguna lk sama tunnus üldpopulatsioonis. Kui seda väärtust on vaja seostada tõenäosusega, tuleks arvutada erikaalu usaldusvahemik lk omadus üldpopulatsioonis suure tõenäosusega P = 1 - α :
.
Näide 4Ühes linnas on kaks kandidaati A Ja B kandideerib linnapeaks. Juhuslikult küsitleti 200 linnaelanikku, kellest 46% vastas, et hääletaks kandidaadi poolt A, 26% - kandidaadile B ja 28% ei tea, kelle poolt nad hääletavad. Määrake kandidaati toetavate linnaelanike osakaalu 95% usaldusvahemik A.
Usaldusvahemik(CI; inglise keeles usaldusvahemik - CI), mis saadi valimiga tehtud uuringus, annab mõõta uuringu tulemuste täpsust (või määramatust), et teha järeldusi kõigi selliste patsientide populatsiooni (üldpopulatsiooni) kohta. ). Õige definitsioon 95% CI võib sõnastada järgmiselt: 95% sellistest intervallidest sisaldab populatsiooni tegelikku väärtust. See tõlgendus on mõnevõrra vähem täpne: CI on väärtuste vahemik, mille piires võite olla 95% kindel, et see sisaldab tõelist väärtust. CI kasutamisel on rõhk kvantitatiivse efekti määramisel, mitte P väärtusel, mis saadakse statistilise olulisuse testimise tulemusena. P väärtus ei hinda ühtki summat, vaid pigem mõõdab tõendite tugevust nullhüpoteesi "mõju puudumise" suhtes. P väärtus iseenesest ei ütle meile midagi erinevuse suuruse ega isegi selle suuna kohta. Seetõttu on P sõltumatud väärtused artiklites või kokkuvõtetes absoluutselt vähe informatiivsed. Seevastu CI näitab nii vahetut huvi pakkuva mõju ulatust, nagu ravi kasulikkus, kui ka tõendite tugevust. Seetõttu on DI otseselt seotud DM praktikaga.
Hindamisviis Statistiline analüüs, mida illustreerib CI, eesmärk on mõõta huvipakkuva mõju suurust (diagnostilise testi tundlikkus, prognoositav esinemissagedus, suhtelise riski vähenemine raviga jne), samuti mõõta selle mõju ebakindlust. Kõige sagedamini on CI väärtuste vahemik hinnangu mõlemal küljel, milles tõenäoline väärtus on, ja võite selles 95% kindel olla. 95% tõenäosuse kasutamise kokkulepe on meelevaldne, nagu ka P väärtus<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».
CI põhineb ideel, et erinevate patsientide rühmadega tehtud sama uuring ei annaks identseid tulemusi, vaid nende tulemused jaguneksid tõelise, kuid tundmatu väärtuse ümber. Teisisõnu kirjeldab CI seda kui "valimist sõltuvat varieeruvust". CI ei kajasta muudest põhjustest tulenevat täiendavat ebakindlust; Eelkõige ei hõlma see patsientide valikulise kaotuse mõju jälgimisele, halba vastavust või ebatäpset tulemuste mõõtmist, pimestamise puudumist jne. Seega alahindab CI alati ebakindluse kogusummat.
Usaldusintervalli arvutamine
Tabel A1.1. Mõnede kliiniliste mõõtmiste standardvead ja usaldusvahemikud
Tavaliselt arvutatakse CI kvantitatiivse mõõdiku vaadeldud hinnangu põhjal, nagu kahe proportsiooni erinevus (d) ja selle erinevuse hinnangu standardvea (SE). Nii saadud ligikaudne 95% CI on d ± 1,96 SE. Valem muutub vastavalt tulemusnäitaja olemusele ja CI katvusele. Näiteks atsellulaarse läkaköha vaktsiini randomiseeritud platseebokontrollitud uuringus tekkis läkaköha 72-l 1670-st (4,3%) vaktsiini saanud imikul ja 240-l 1665-st (14,4%) kontrollrühmas. Protsentuaalne erinevus, mida nimetatakse absoluutse riski vähendamiseks, on 10,1%. Selle erinevuse SE on 0,99%. Vastavalt on 95% CI 10,1% + 1,96 x 0,99%, st. 8,2 kuni 12,0.
Vaatamata erinevatele filosoofilistele lähenemisviisidele on CI-d ja statistilise olulisuse testid matemaatiliselt tihedalt seotud.
Seega on P väärtus “oluline”, st. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.
Hinnangu määramatus (ebatäpsus), väljendatuna CI-s, on suuresti seotud valimi suuruse ruutjuurega. Väikesed valimid annavad vähem teavet kui suured valimid ja väiksemates valimites on CI-d vastavalt laiemad. Näiteks artiklis, milles võrreldi Helicobacter pylori infektsiooni diagnoosimiseks kasutatud kolme testi toimivust, teatati uurea hingamistesti tundlikkusest 95,8% (95% CI 75–100). Kuigi 95,8% näib muljetavaldav, tähendab 24 täiskasvanud H. pylori patsiendi väike valimi suurus, et selles hinnangus on märkimisväärne ebakindlus, nagu näitab lai CI. Tõepoolest, alumine piir 75% on palju madalam kui 95,8% hinnang. Kui sama tundlikkust täheldataks 240 inimesest koosnevas valimis, oleks 95% CI 92,5–98,0, mis annab suurema kindlustunde, et test on väga tundlik.
Randomiseeritud kontrollitud uuringutes (RCT) on ebaolulised tulemused (st need, mille P > 0,05) on eriti vastuvõtlikud valesti tõlgendamisele. CI on siin eriti kasulik, kuna see näitab, kui ühilduvad tulemused kliiniliselt kasuliku tegeliku toimega. Näiteks RCT-s, kus võrreldi õmblust jämesoole klambri anastomoosiga, tekkis haavainfektsioon vastavalt 10,9% ja 13,5% patsientidest (P = 0,30). Selle erinevuse 95% usaldusvahemik on 2,6% (-2 kuni +8). Isegi selles uuringus, mis hõlmas 652 patsienti, on tõenäoline, et kahest protseduurist tulenevate infektsioonide esinemissagedus on tagasihoidlik. Mida väiksem on uuring, seda suurem on ebakindlus. Sung et al. viidi läbi RCT, milles võrreldi oktreotiidi infusiooni erakorralise skleroteraapiaga ägeda veenilaiendite verejooksu korral 100 patsiendil. Oktreotiidi rühmas oli verejooksu peatamise määr 84%; skleroteraapia rühmas - 90%, mis annab P = 0,56. Pange tähele, et jätkuva verejooksu määrad on sarnased mainitud uuringu haavainfektsiooni omadega. Sel juhul on sekkumiste erinevuse 95% CI 6% (-7 kuni +19). See vahemik on üsna lai võrreldes 5% erinevusega, mis pakuks kliinilist huvi. On selge, et uuring ei välista olulist erinevust efektiivsuses. Seetõttu ei pea kindlasti paika autorite järeldus "oktreotiidi infusioon ja skleroteraapia on veenilaiendite verejooksu ravis võrdselt tõhusad". Sellistel juhtudel, kus absoluutse riski vähendamise (ARR) 95% CI sisaldab nulli, nagu siin, on NNT CI (ravimiseks vajalik arv) üsna raske tõlgendada. NLP ja selle CI saadakse ACP pöördväärtustest (korrutades need 100-ga, kui need väärtused on antud protsentides). Siin saame tuumaelektrijaama = 100: 6 = 16,6 95% CI-ga -14,3 kuni 5,3. Nagu näha tabeli joonealusest märkusest "d". A1.1, see CI sisaldab NTPP väärtusi vahemikus 5,3 kuni lõpmatuseni ja NTLP väärtusi vahemikus 14,3 kuni lõpmatuseni.
CI-sid saab koostada kõige sagedamini kasutatavate statistiliste hinnangute või võrdluste jaoks. RCT-de puhul sisaldab see erinevust keskmiste proportsioonide, suhteliste riskide, koefitsientide ja NRR-ide vahel. Samamoodi saab CI-d saada kõigi peamiste hinnangute kohta, mis on tehtud diagnostiliste testide täpsuse uuringutes – tundlikkus, spetsiifilisus, positiivne ennustav väärtus (mis kõik on lihtsad proportsioonid) ja tõenäosussuhted – hinnangud, mis on saadud metaanalüüsides ja võrdluses kontrolliga. uuringud. Personaalarvuti programm, mis katab paljusid DI kasutusviise, on saadaval ajakirja Statistics with Confidence teise väljaandega. Proportsioonide CI arvutamise makrod on Exceli ning statistikaprogrammide SPSS ja Minitab jaoks vabalt saadaval aadressil http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.
Ravi mõju mitmekordne hindamine
Kuigi CI-de koostamine on uuringu esmaste tulemuste jaoks soovitav, pole neid vaja kõigi tulemuste jaoks. CI puudutab kliiniliselt olulisi võrdlusi. Näiteks kahe rühma võrdlemisel on õige CI see, mis on loodud rühmadevahelise erinevuse jaoks, nagu on näidatud ülaltoodud näidetes, mitte CI, mille saab koostada iga rühma hinnangu jaoks. Mitte ainult ei ole kasutu anda iga rühma hinnete jaoks eraldi CI-sid, see esitlus võib olla eksitav. Samamoodi on õige lähenemisviis ravi efektiivsuse võrdlemisel erinevates alarühmades kahe (või enama) alarühma otsene võrdlemine. On vale eeldada, et ravi on efektiivne ainult ühes alarühmas, kui selle CI välistab väärtuse, mis vastab mõju puudumisele, samas kui teised seda ei tee. CI-d on kasulikud ka mitme alarühma tulemuste võrdlemisel. Joonisel fig. A1.1 näitab eklampsia suhtelist riski preeklampsiaga naistel naiste alarühmades, kes said platseebokontrolliga magneesiumsulfaadi RCT-d.
Riis. A1.2. Forest Graph näitab veiste rotaviiruse vaktsiini 11 randomiseeritud kliinilise uuringu tulemusi kõhulahtisuse ennetamiseks võrreldes platseeboga. Kõhulahtisuse suhtelise riski hindamiseks kasutati 95% usaldusvahemikku. Musta ruudu suurus on võrdeline teabe hulgaga. Lisaks on näidatud ravi efektiivsuse kokkuvõtlik hinnang ja 95% usaldusvahemik (tähistatud rombiga). Metaanalüüsis kasutati juhuslike mõjude mudelit, mis ületab mõned eelnevalt kehtestatud mudelid; näiteks võib see olla valimi suuruse arvutamisel kasutatud suurus. Rangema kriteeriumi kohaselt peab kogu CI-de vahemik näitama kasu, mis ületab eelnevalt kindlaksmääratud miinimumi.
Oleme juba arutanud ekslikkust pidada statistilise olulisuse puudumist näitajaks, et kaks ravi on võrdselt tõhusad. Sama oluline on mitte samastada statistilist olulisust kliinilise tähtsusega. Kliinilist tähtsust võib eeldada, kui tulemus on statistiliselt oluline ja ravivastuse ulatus
Uuringud võivad näidata, kas tulemused on statistiliselt olulised ja millised on kliiniliselt olulised ja millised mitte. Joonisel fig. A1.2 näitab nelja katse tulemusi, mille puhul kogu CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.
SAGEDUSTE JA OSADE KINNITUSVÄLJAD
© 2008
Riiklik Rahvatervise Instituut, Oslo, Norra
Artiklis kirjeldatakse ja käsitletakse sageduste ja proportsioonide usaldusvahemike arvutamist Waldi, Wilsoni, Klopper-Pearsoni meetodite abil, kasutades nurkteisendust ja Waldi meetodit Agresti-Cowlli korrektsiooniga. Esitatud materjal annab üldist teavet sageduste ja proportsioonide usaldusvahemike arvutamise meetodite kohta ning on mõeldud äratama ajakirja lugejates huvi mitte ainult usaldusvahemike kasutamise vastu oma uurimistöö tulemuste esitamisel, vaid ka erialakirjanduse lugemise vastu enne alustamist. tööd tulevaste väljaannete kallal.
Märksõnad: usaldusvahemik, sagedus, proportsioon
Ühes varasemas publikatsioonis mainiti lühidalt kvalitatiivsete andmete kirjeldust ja teatati, et nende intervallhinnang on eelistatavam punkthinnangule, et kirjeldada uuritava tunnuse esinemissagedust üldpopulatsioonis. Tõepoolest, kuna uuringud viiakse läbi valimiandmete abil, peab tulemuste projektsioon üldkogumile sisaldama valimi hinnangus ebatäpsust. Usaldusvahemik on hinnangulise parameetri täpsuse mõõt. Huvitav on see, et mõnes arstidele mõeldud statistika põhitõdesid käsitlevas raamatus jäetakse sageduste usaldusvahemike teema täielikult tähelepanuta. Käesolevas artiklis vaatleme mitmeid viise sageduste usaldusvahemike arvutamiseks, eeldades valimi omadusi, nagu mittekordumine ja representatiivsus, samuti vaatluste sõltumatust üksteisest. Käesolevas artiklis ei mõisteta sagedust absoluutarvuna, mis näitab, mitu korda see või teine väärtus kokkuvõttes esineb, vaid suhtelist väärtust, mis määrab uuringus osalejate osakaalu, kellel on uuritav tunnus.
Biomeditsiinilistes uuringutes kasutatakse kõige sagedamini 95% usaldusvahemikke. See usaldusvahemik on piirkond, millesse tegelik osakaal langeb 95% ajast. Teisisõnu võib 95% kindlusega väita, et tunnuse esinemissageduse tegelik väärtus üldpopulatsioonis jääb 95% usaldusvahemikku.
Enamik meditsiiniteadlastele mõeldud statistikaõpikuid teatab, et sagedusviga arvutatakse valemi abil
kus p on tunnuse esinemise sagedus valimis (väärtus 0 kuni 1). Enamikus kodumaistes teadusartiklites on märgitud tunnuse esinemissageduse väärtus valimis (p), samuti selle viga (s) kujul p ± s. Siiski on otstarbekam esitada tunnuse esinemissageduse üldpopulatsioonis 95% usaldusvahemik, mis hõlmab väärtusi alates
enne.
Mõnes õpikus on väikeste valimite puhul soovitatav N - 1 vabadusastme puhul väärtus 1,96 asendada t väärtusega, kus N on vaatluste arv valimis. T väärtuse leiate t-jaotuse tabelitest, mis on saadaval peaaegu kõigis statistikaõpikutes. t jaotuse kasutamine Waldi meetodi jaoks ei anna nähtavaid eeliseid teiste allpool käsitletud meetodite ees ja seetõttu ei tervita seda mõned autorid.
Ülaltoodud meetod sageduste või murdude usaldusvahemike arvutamiseks on oma nime saanud Abraham Waldi järgi (Abraham Wald, 1902–1950), kuna seda hakati laialdaselt kasutama pärast Waldi ja Wolfowitzi avaldamist 1939. aastal. Meetodi enda pakkus aga välja Pierre Simon Laplace (1749–1827) juba 1812. aastal.
Waldi meetod on väga populaarne, kuid selle rakendamine on seotud märkimisväärsete probleemidega. Meetodit ei soovitata kasutada väikeste valimite puhul, samuti juhtudel, kui tunnuse esinemissagedus kipub olema 0 või 1 (0% või 100%) ning sageduste 0 ja 1 puhul pole see lihtsalt võimalik. normaaljaotuse lähendus, mida kasutatakse vea arvutamisel, "ei tööta" juhtudel, kui n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.
Kuna uus muutuja on normaalse jaotusega, on muutuja φ 95% usaldusvahemiku alumine ja ülemine piir φ-1,96 ja φ+1,96 vasakult">
Väikeste valimite 1,96 asemel on N - 1 vabadusastmega soovitatav asendada t väärtus. See meetod ei anna negatiivseid väärtusi ja võimaldab teil sageduste usaldusvahemikke täpsemalt hinnata kui Waldi meetod. Lisaks on seda kirjeldatud paljudes kodumaistes meditsiinistatistika teatmeteostes, mis aga ei toonud kaasa selle laialdast kasutamist meditsiiniuuringutes. Usaldusvahemike arvutamine nurgateisendusega ei ole soovitatav 0-le või 1-le lähenevate sageduste korral.
Siinkohal tavaliselt lõpeb usaldusvahemike hindamise meetodite kirjeldus enamikus arstiteadlastele mõeldud statistika aluste raamatutes ning see probleem on omane mitte ainult kodumaisele, vaid ka välismaisele kirjandusele. Mõlemad meetodid põhinevad keskpiiri teoreemil, mis tähendab suurt valimit.
Arvestades puudusi usaldusvahemike hindamisel ülaltoodud meetodite abil, pakkusid Clopper (Clopper) ja Pearson (Pearson) 1934. aastal välja meetodi nn täpse usaldusvahemiku arvutamiseks, võttes arvesse uuritava tunnuse binoomjaotust. See meetod on saadaval paljudes veebikalkulaatorites, kuid sel viisil saadud usaldusvahemikud on enamasti liiga laiad. Samal ajal on seda meetodit soovitatav kasutada juhtudel, kui on vaja konservatiivset hinnangut. Meetodi konservatiivsus suureneb valimi suuruse vähenemisel, eriti N puhul< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.
Paljude statistikute sõnul tehakse sageduste usaldusvahemike optimaalseim hinnang Wilsoni meetodi abil, mis pakuti välja juba 1927. aastal, kuid mida kodumaistes biomeditsiinilistes uuringutes praktiliselt ei kasutatud. See meetod mitte ainult ei võimalda hinnata usaldusvahemikke nii väga väikeste kui ka väga kõrgete sageduste jaoks, vaid on rakendatav ka väikese arvu vaatluste jaoks. Üldiselt on usaldusvahemik Wilsoni valemi järgi kujul alates
kus see võtab 95% usaldusvahemiku arvutamisel väärtuse 1,96, N on vaatluste arv ja p on tunnuse sagedus valimis. See meetod on saadaval veebikalkulaatorites, seega pole selle rakendamine problemaatiline. ja ei soovita seda meetodit kasutada n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .
Lisaks Wilsoni meetodile arvatakse, et Agresti-Caulli korrigeeritud Waldi meetod annab sageduste usaldusvahemiku optimaalse hinnangu. Agresti-Coulle'i parandus on Waldi valemis valimi tunnuse esinemissageduse (p) asendamine p`-ga, mille arvutamisel lisatakse lugejale 2 ja nimetajale 4, st. , p` = (X + 2) / (N + 4), kus X on uuringus osalejate arv, kellel on uuritav tunnus, ja N on valimi suurus. See modifikatsioon annab Wilsoni valemi tulemustele väga sarnased tulemused, välja arvatud juhul, kui sündmuste määr läheneb 0% või 100% ja valim on väike. Lisaks ülaltoodud sageduste usaldusvahemike arvutamise meetoditele on väikeste valimite puhul välja pakutud pidevuse parandusi nii Waldi kui ka Wilsoni meetodi puhul, kuid uuringud on näidanud, et nende kasutamine ei ole asjakohane.
Kaaluge ülaltoodud meetodite rakendamist usaldusvahemike arvutamiseks kahe näite abil. Esimesel juhul uurime suurt valimit 1000 juhuslikult valitud uuringus osalejast, kellest 450-l on uuritav tunnus (olgu see siis riskitegur, tulemus või mõni muu tunnus), mille esinemissagedus on 0,45 või 45%. Teisel juhul viiakse uuring läbi väikese valimiga, näiteks ainult 20 inimesega, ja ainult 1 uuringus osalejal (5%) on uuritav tunnus. Usaldusvahemikud Waldi meetodi jaoks, Waldi meetodi jaoks Agresti-Colli korrektsiooniga ja Wilsoni meetodi jaoks arvutati Jeff Sauro välja töötatud veebikalkulaatori abil (http://www./wald.htm). Järjepidevuse järgi korrigeeritud Wilsoni usaldusvahemikud arvutati kalkulaatoriga, mille pakub Wassar Stats: Statistical Computation veebisait (http://faculty.vassar.edu/lowry/prop1.html). Fisheri nurkteisendust kasutavad arvutused viidi läbi "käsitsi", kasutades t kriitilist väärtust vastavalt 19 ja 999 vabadusastme jaoks. Mõlema näite arvutustulemused on toodud tabelis.
Usaldusvahemikud on arvutatud kahe tekstis kirjeldatud näite jaoks kuuel erineval viisil
Usaldusintervalli arvutamise meetod |
P=0,0500 ehk 5% | 95% CI, kui X = 450, N = 1000, P = 0,4500 või 45% |
–0,0455–0,2541 | ||
Walda Agresti-Colli korrektsiooniga | <,0001–0,2541 | |
Wilson koos järjepidevuse korrektsiooniga | ||
Klopper-Pearsoni "täpne meetod" | ||
Nurga teisendus | <0,0001–0,1967 |
Nagu tabelist näha, läheb esimese näite puhul "üldtunnustatud" Waldi meetodil arvutatud usaldusvahemik negatiivsesse piirkonda, mis ei saa sageduste puhul nii olla. Kahjuks pole sellised juhtumid vene kirjanduses haruldased. Traditsiooniline viis andmete esitamiseks sagedusena ja selle viga varjab seda probleemi osaliselt. Näiteks kui tunnuse esinemissagedus (protsentides) on esitatud kui 2,1 ± 1,4, siis see ei ole nii "ärritav" kui 2,1% (95% CI: –0,7; 4,9), kuigi ja tähendab sama. Waldi meetod Agresti-Coulle'i parandusega ja nurkteisendust kasutav arvutus annab nullile kalduva alumise piiri. Wilsoni meetod koos pidevuse korrigeerimisega ja "täpne meetod" annavad laiemad usaldusvahemikud kui Wilsoni meetod. Teise näite puhul annavad kõik meetodid ligikaudu ühesugused usaldusvahemikud (erinevused ilmnevad vaid tuhandikes), mis pole üllatav, kuna sündmuse sagedus selles näites ei erine palju 50% -st ja valimi suurus on üsna suur .
Lugejatele, keda see probleem huvitab, võib soovitada R. G. Newcombe’i ja Browni, Cai ja Dasgupta töid, mis annavad plussid ja miinused vastavalt 7 ja 10 erineva usaldusintervalli arvutamise meetodi kasutamisele. Kodumaistest käsiraamatutest on soovitatav raamat ja, milles lisaks teooria üksikasjalikule kirjeldusele on välja toodud Waldi, Wilsoni meetodid, samuti meetod usaldusvahemike arvutamiseks, võttes arvesse binoomsagedusjaotust. . Lisaks tasuta veebikalkulaatoritele (http://www./wald.htm ja http://faculty.vassar.edu/lowry/prop1.html) saab sageduste (ja mitte ainult!) usaldusvahemikke arvutada, kasutades CIA programm ( Confidence Intervals Analysis), mille saab alla laadida aadressilt http://www. meditsiinikool. soton. ac. uk/cia/ .
Järgmises artiklis käsitletakse kvalitatiivsete andmete võrdlemise ühemõõtmelisi viise.
Bibliograafia
Lihtkeeles meditsiinistatistika: sissejuhatav kursus / A. Banerzhi. - M. : Praktiline meditsiin, 2007. - 287 lk. Meditsiinistatistika / . - M. : Meditsiiniinfo Agentuur, 2007. - 475 lk. Meditsiini-bioloogiline statistika / S. Glants. - M. : Praktika, 1998. Andmetüübid, leviku kontrollimine ja kirjeldav statistika / // Inimökoloogia - 2008. - Nr 1. - Lk 52–58. KOOS. Meditsiinistatistika: õpik / . - Rostov n / D: Phoenix, 2007. - 160 lk. Rakendusmeditsiiniline statistika / ,. - Peterburi. : Folio, 2003. - 428 lk. F. Biomeetria / . - M. : Kõrgkool, 1990. - 350 lk. A. Matemaatiline statistika meditsiinis / , . - M. : Rahandus ja statistika, 2007. - 798 lk. Matemaatiline statistika kliinilistes uuringutes / , . - M. : GEOTAR-MED, 2001. - 256 lk. Junkerov V. JA. Meditsiiniuuringute andmete meditsiinilis-statistiline töötlemine /,. - Peterburi. : VmedA, 2002. - 266 lk. Agresti A. Ligikaudne on parem kui täpne binoomproportsioonide intervallide hindamiseks / A. Agresti, B. Coull // Ameerika statistik. - 1998. - N 52. - S. 119-126. Altman D. Kindel statistika // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 lk. Pruun L.D. Intervall estimation for a binomial ratio / L. D. Brown, T. T. Cai, A. Dasgupta // Statistikateadus. - 2001. - N 2. - Lk 101-133. Clopper C.J. Usaldus- või usalduspiiride kasutamine, mida illustreeritakse binoomarvu puhul / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - Lk 404-413. Garcia-Perez M. A. Binoomparameetri usaldusvahemikust / M. A. Garcia-Perez // Kvaliteet ja kvantiteet. - 2005. - N 39. - Lk 467-481. Motulsky H. Intuitiivne biostatistika // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 lk. Newcombe R.G. Kahepoolsed usaldusintervallid ühe proportsiooni jaoks: seitsme meetodi võrdlus / R. G. Newcombe // Meditsiini statistika. - 1998. - N. 17. - Lk 857–872. Sauro J. Valmimismäärade hindamine väikestest valimitest binoomsete usaldusvahemike abil: võrdlused ja soovitused / J. Sauro, J. R. Lewis // Proceedings of the human factor and ergonomics Society aastakoosolek. – Orlando, Florida, 2005. Wald A. Pidevate jaotusfunktsioonide usalduspiirid // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - Lk 105–118. Wilson E.B. Tõenäoline järeldus, pärimisseadus ja statistiline järeldus / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - Lk 209-212.PROPORTSIOONIDE KONFIDENTSIAALID
A. M. Grjibovski
Riiklik Rahvatervise Instituut, Oslo, Norra
Artiklis esitatakse mitmed meetodid binoomproportsioonide usaldusvahemike arvutamiseks, nimelt Waldi, Wilsoni, arcsiini, Agresti-Coulli ja täpsed Clopper-Pearsoni meetodid. Töö annab ainult üldise sissejuhatuse binoomproportsiooni usaldusintervallide hindamise probleemisse ja selle eesmärk ei ole mitte ainult ärgitada lugejaid kasutama usaldusvahemikke enda empiiriliste uurimisvahemike tulemuste esitamisel, vaid ka julgustada neid enne statistikaraamatutega tutvuma. enda andmete analüüsimiseks ja käsikirjade ettevalmistamiseks.
võtmesõnad: usaldusvahemik, proportsioon
Kontaktinfo:
– Oslo, Norra riikliku rahvatervise instituudi vanemnõunik