Lietišķā psiholoģija. Uzticamība - rezultātu konsekvences pakāpe, kas iegūta, atkārtoti pielietojot mērīšanas paņēmienu a) L - dati

Pirms psihodiagnostikas metodes var izmantot praktiskiem mērķiem, tās ir jāpārbauda pēc vairākiem formāliem kritērijiem, kas apliecina to augsto kvalitāti un efektivitāti. Galvenie psihodiagnostikas metožu novērtēšanas kritēriji ir uzticamība un derīgums. Ārvalstu psihologi sniedza lielu ieguldījumu šo jēdzienu attīstībā (A. Anastasi, E. Ghiselli, J. Guilford, L. Cronbach, R. Thorndike, E. Hagen u.c.). Viņi izstrādāja formālu loģisko un matemātiski statistisko aparātu (galvenokārt korelācijas metodi un faktu analīzi), lai pamatotu metožu atbilstības pakāpi norādītajiem kritērijiem.

Tradicionālajā testēšanā termins "uzticamība" nozīmē relatīvo noturību, stabilitāti, testa rezultātu konsekvenci sākotnējās un atkārtotās lietošanas laikā tiem pašiem subjektiem.

Metodes uzticamība- tas ir kritērijs, kas norāda uz psiholoģisko mērījumu precizitāti, tas ir, ļauj spriest, cik ticami ir iegūtie rezultāti.

Tā ir priekšmetu testēšanas rezultātu konsekvence dažādos laika punktos, primārās un sekundārās testēšanas laikā un izmantojot uzdevumus, kas atšķiras pēc līdzvērtības un satura. Uzticamība raksturo īpašību testus, bet ne stāvokļus. Īpašības:

    1. Pētījumu rezultātu reproducējamība.
    2. Mērījumu precizitāte.
    3. Rezultātu ilgtspējība.

Metožu uzticamības pakāpe ir atkarīga no daudziem iemesliem. Starp negatīvie faktori visbiežāk minētie ir šādi:

    1. diagnosticētā īpašuma nestabilitāte;
    2. diagnostikas metožu nepilnības (norādījumi ir pavirši sastādīti, uzdevumi pēc būtības ir neviendabīgi, instrukcijas metodes prezentēšanai subjektiem nav skaidri formulētas utt.);
    3. mainīga pārbaudes situācija (dažādi diennakts laiki, kad tiek veikti eksperimenti, atšķirīgs telpas apgaismojums, sveša trokšņa esamība vai neesamība utt.);
    4. eksperimentētāja uzvedības atšķirības (no eksperimenta uz eksperimentu viņš dažādi pasniedz norādījumus, dažādi stimulē uzdevumu izpildi utt.);
    5. subjekta funkcionālā stāvokļa svārstības (vienā eksperimentā ir laba veselība, citā - nogurums utt.);
    6. subjektivitātes elementi rezultātu vērtēšanas un interpretācijas metodēs (fiksējot testa subjektu atbildes, atbildes tiek vērtētas pēc pabeigtības pakāpes, oriģinalitātes utt.).

Viens no būtiskākajiem metodikas uzticamības paaugstināšanas līdzekļiem ir eksāmenu norises vienveidība, tās stingrais regulējums: viena vide, viena veida norādījumi, vienādi laika ierobežojumi visiem, saskarsmes ar pētāmajiem metodes un īpatnības, un tā tālāk.

Metožu uzticamības raksturlielumus lielā mērā ietekmē pētāmā izlase. Tas var vai nu samazināt, vai pārvērtēt šo rādītāju; piemēram, uzticamību var mākslīgi palielināt, ja izlasē ir neliela rezultātu izkliede, t.i. ja rezultāti ir tuvu viens otram. Tāpēc rokasgrāmatā parasti ir aprakstīts paraugs, uz kura tika noteikta tehnikas uzticamība.

Šobrīd uzticamība arvien vairāk tiek noteikta uz viendabīgākajiem paraugiem, t.i. par līdzīgiem paraugiem pēc dzimuma, vecuma, izglītības līmeņa, profesionālās sagatavotības utt.

Ir tik daudz metožu uzticamības šķirņu, cik ir apstākļi, kas ietekmē diagnostikas testu rezultātus. Tā kā visi ticamības veidi atspoguļo divu neatkarīgi iegūto rādītāju sēriju konsekvences pakāpi, matemātiskā un statistiskā tehnika, ar kuru tiek noteikta metodoloģijas ticamība, ir korelācijas (pēc Pīrsona vai Spīrmena). Jo vairāk iegūtais korelācijas koeficients tuvojas vienotībai, jo lielāka ir ticamība un otrādi.

K.M. Gurevičs piedāvāts interpretēt uzticamību šādi:

    1. paša mērinstrumenta uzticamība (uzticamības koeficients);
    2. pētāmās pazīmes stabilitāte (stabilitātes koeficients);
    3. noturība, t.i. rezultātu relatīvā neatkarība no eksperimentētāja personības (noturības koeficients).

Mērinstrumentu raksturojošo rādītāju ierosināts saukt par ticamības koeficientu; mērītās īpašības stabilitāti raksturojošs rādītājs - stabilitātes koeficients; un rādītājs eksperimentētāja Personības ietekmes novērtēšanai ir noturības koeficients. Tieši šādā secībā ieteicams pārbaudīt metodiku: vispirms vēlams pārbaudīt mērinstrumentu. Ja iegūtie dati ir apmierinoši, tad varam pāriet pie izmērāmās īpašības stabilitātes mēra noteikšanas un pēc tam, ja nepieciešams, ņemt vērā noturības kritēriju. (Uzticamība: tests-atkārtots tests, paralēlas formas, ķermeņa daļas, iekšējā konsistence, faktoru dispersija).

Mērinstrumenta uzticamības noteikšana. Mērījuma precizitāte un objektivitāte ir atkarīga no tā, kā ir sastādīta metodika, cik pareizi izvēlēti uzdevumi un cik vienveidīgs tas ir.

Lai pārbaudītu mērinstrumenta uzticamību, norādot tā viendabīgumu (viendabīgumu), tiek izmantota sadalīšanas metode. Uzdevumi tiek sadalīti pāra un nepāra (jāizpilda visi uzdevumi), un pēc tam rezultāti tiek korelēti viens ar otru. Ja tehnika būs viendabīga, tad starp šiem puslaikiem panākumu starpība nebūs liela, koeficients būs augsts. Jūs varat salīdzināt daļas, bet labāk ir salīdzināt pāra un nepāra, jo šī metode nav atkarīga no treniņa, noguruma utt.

Paņēmiens ir uzticams, ja koeficients nav zemāks 0,75 - 0,85, labāk 0,90 un vairāk.

Pētītās pazīmes stabilitātes noteikšana. Ir arī jānosaka, cik stabila ir pazīme, kuru pētnieks plāno izmērīt. Zīme laika gaitā var mainīties, taču tās svārstībām nevajadzētu būt neparedzamām.

Lai pārbaudītu, tiek izmantota metode, ko sauc par atkārtotu pārbaudi. Tas sastāv no priekšmetu atkārtotas pārbaudes, izmantojot to pašu tehniku. Stabilitāti vērtē pēc korelācijas koeficienta starp pirmās un otrās pārbaudes rezultātiem. Tas norāda, vai katrs subjekts saglabā vai nesaglabā savu kārtas numuru izlasē.

Stabilitātes pakāpi ietekmē dažādi faktori. Jāievēro pārbaudes procedūras vienveidība.

Nosakot pazīmes stabilitāti, liela nozīme ir laika intervālam starp 1 un 2 izmeklējumiem. Jo īsāks šis intervāls, jo lielāka iespēja, ka šī zīme saglabās pirmā testa līmeni. Vēlams veikt atkārtotu pārbaudi neilgu laiku pēc pārbaudes. Eksperimentētājs pats nosaka šo periodu, bet biežāk psiholoģiskajā literatūrā tie norāda vairāku mēnešu intervālu (bet ne vairāk kā sešus mēnešus). Jautājums par izmērāmā īpašuma stabilitāti ne vienmēr tiek atrisināts vienādi. Lēmums ir atkarīgs no diagnosticētā simptoma būtības.

Ja mērāmā īpašība jau ir izveidota, tad koeficients nedrīkst būt mazāks par 0,80.

Noturības definīcija, t.i. rezultātu relatīvā neatkarība no eksperimentētāja personības. Tā kā tehnika tiek izstrādāta turpmākai lietošanai citiem psihodiagnostiķiem, ir jānosaka, cik lielā mērā tās rezultātus ietekmē eksperimentētāja personība. Noturības koeficientu nosaka, korelējot divu eksperimentu rezultātus, kas veikti ar vienu un to pašu paraugu, bet ar dažādiem eksperimentētājiem. Korelācijas koeficients nedrīkst būt zemāks par 0,80.

Jautājums par derīgumu tiek izlemts pēc uzticamības noteikšanas, jo neuzticama tehnika nevar būt derīga.

Derīgums tests - jēdziens, kas stāsta, ko tests mēra un cik labi tas to dara (A. Anastasi). Derīgums būtībā tas ir sarežģīts raksturlielums, kas ietver, no vienas puses, informāciju par to, vai tehnika ir piemērota mērīšanai, kam tā radīta, un, no otras puses, kāda ir tās efektivitāte, lietderība un praktiskā lietderība.

Šī iemesla dēļ nav vienotas universālas pieejas derīguma noteikšanai. Atkarībā no tā, kuru derīguma aspektu pētnieks vēlas apsvērt, tiek izmantotas dažādas pierādījumu metodes. Citiem vārdiem sakot, derīguma jēdziens ietver dažādus tā veidus, kuriem ir sava īpaša nozīme. Metodoloģijas derīguma pārbaudi sauc par validāciju.

Validitāte ir konkrēta pētījuma atbilstība pieņemtajiem standartiem (nevainojams eksperiments).

Derīgums tās pirmajā izpratnē ir saistīts ar pašu metodoloģiju, t.i. tas ir mērinstrumenta derīgums. Šo verifikācijas veidu sauc par teorētisko validāciju. Derīgums tās otrajā izpratnē attiecas ne tik daudz uz metodoloģiju, cik uz tās izmantošanas mērķi. Tā ir pragmatiska apstiprināšana.

Teorētiskās validācijas laikā pētnieku interesē pati īpašība, ko mēra ar tehniku.

Tā kā teorētiskās validācijas noteikšanai ir grūti atrast kādu neatkarīgu kritēriju, kas atrodas ārpus metodoloģijas, un tāpēc nepamatoti apgalvojumi par šīs metodikas pamatotību iepriekš tika uzskatīti par pašsaprotamiem. Tā kā teorētiskās validācijas mērķis ir pierādīt, ka tehnika mēra tieši to īpašību, kas tai ir jāizmēra. Teorētiskajai apstiprināšanai galvenā problēma ir psiholoģisko parādību attiecības ar to rādītājiem, ar kuru palīdzību šīs psiholoģiskās parādības cenšas izzināt. Tas parāda, ka autora iecere un metodoloģijas rezultāti sakrīt.

Nav tik grūti veikt jaunas tehnikas teorētisko validāciju, ja jau ir tehnika ar zināmu, pārbaudītu derīgumu noteiktas īpašības mērīšanai. Korelācijas klātbūtne starp jaunu un līdzīgu veco tehniku ​​norāda, ka izstrādātā tehnika mēra tādu pašu psiholoģisko kvalitāti kā atsauces tehnika.

Lai pārbaudītu teorētisko derīgumu, ir svarīgi, no vienas puses, noteikt saistību pakāpi ar radniecīgu paņēmienu (konverģences derīgums), un, no otras puses, šīs saiknes neesamību ar metodēm, kurām ir atšķirīgs teorētiskais pamatojums (diskriminējošais derīgums). ).

Būtiska loma metodoloģijas pasākumu izpratnē ir tās rādītāju salīdzināšanai ar praktiskām aktivitātes formām. Ir svarīgi, lai metodoloģija būtu teorētiski izstrādāta.

Pragmatiska apstiprināšana

Tiek pārbaudīta metodoloģijas praktiskā efektivitāte, nozīme un lietderība, jo metodiku var izmantot tikai tad, ja ir pierādīts, ka mērāmā īpašība izpaužas noteikta veida Darbībās.

Pragmatiskā derīguma pārbaudei tiek izmantots neatkarīgs ārējais kritērijs - pētāmās īpašības izpausmes ikdienas dzīvē rādītājs. Šāds kritērijs var būt akadēmiskais sniegums (mācīšanās spēju pārbaudēm, sasniegumu pārbaudēm, intelekta pārbaudēm), ražošanas sasniegumi (profesionālās orientācijas metodēm), reālo darbību efektivitāte - zīmēšana, modelēšana utt. (speciālo spēju pārbaudēm). ), subjektīvie vērtējumi ( personības testiem).

Amerikāņu pētnieki Tifins un Makkormiks identificēja 4 ārējo kritēriju veidus:

    1. Veiktspējas kritērijs (veiktā darba apjoms, akadēmiskais sniegums, laiks, kvalifikācijas pieauguma temps).
    2. Subjektīvie kritēriji (ietver dažāda veida atbildes, kas atspoguļo cilvēka attieksmi pret kaut ko, viņa uzskatus, uzskatus).
    3. Fizioloģiskais kritērijs (izmanto, pētot ārējās vides ietekmi, kas ietekmē ķermeni un psihi).
    4. Nejaušības kritērijs (piemēram, ja mērķis ir saistīts ar tādu personu atlasi darbam, kuras ir mazāk pakļautas nelaimes gadījumiem).

Ārējam kritērijam jābūt 3 galvenajām prasībām:

    1. Tam jābūt atbilstošam, tas ir, jābūt pārliecībai, ka kritērijs ietver tieši tās individuālās psihes iezīmes, kuras mēra diagnostikas tehnika. Ārējam kritērijam un diagnostikas modelim jābūt iekšējā semantiskajā atbilstībā.
    2. Jābūt brīvam no traucējumiem (piesārņojuma). Pētījumiem būtu jāizvēlas cilvēku grupas, kuras atrodas vairāk vai mazāk identiskos apstākļos.
    3. Jābūt uzticamam. Pētāmās funkcijas noturība un stabilitāte.

Metodoloģijas derīguma novērtējums var būt kvantitatīvs un kvalitatīvs.

Lai aprēķinātu kvantitatīvo rādītāju (validitātes koeficientu), diagnostikas paņēmienu pielietošanas rezultātā iegūtie rezultāti tiek salīdzināti ar to pašu indivīdu datiem, kas iegūti, izmantojot ārēju kritēriju. Tiek izmantoti dažādi lineārās korelācijas veidi (saskaņā ar Spīrmenu, pēc Pīrsena teiktā).

Mērāmā īpašuma būtības kvalitatīvs apraksts. Šeit netiek izmantota statistikas apstrāde.

Ir vairāki derīguma veidi, sakarā ar diagnostikas tehnikas īpatnībām, kā arī ārējā kritērija pagaidu statusu:

    1. Satura validitāte (izmanto sasniegumu pārbaudēs): 3 - 4 jautājumi no lielas tēmas var parādīt skolēna patiesās zināšanas. Lai to izdarītu, diagnostikas rezultāti tiek salīdzināti ar skolotāja ekspertu vērtējumiem.
    2. Contemporaneous validity jeb pašreizējā validitāte – tiek apkopoti dati, kas attiecas uz šo laiku: akadēmiskais sniegums, produktivitāte utt. Testa panākumu rezultāti korelē ar tiem.
    3. “Prognozējošais” derīgums (“prognozējams”). To nosaka uzticams ārējs kritērijs, bet informācija par to tiek apkopota kādu laiku pēc pārbaudes. Prognozes precizitāte ir apgriezti saistīta ar šādai prognozēšanai noteikto laiku.
    4. "Retrospektīvs" derīgums. Noteikts, pamatojoties uz kritēriju, kas atspoguļo pagātnes notikumus vai kvalitātes stāvokli. Var izmantot, lai ātri iegūtu informāciju par tehnikas prognozēšanas iespējām.

Šādu testu grupa ļauj novērtēt jebkura veida darbības meistarības līmeni. Sasniegumu pārbaudes ir balstītas uz dažādām inteliģences un veiktspējas idejām un modeļiem.

Viens no plaši izmantotajiem intelekta modeļiem, uz kura var balstīties sasniegumu pārbaudes, ir Dž. Gilforda modelis. Viņa modeļa pamatā ir trīs mainīgie: darbības, saturs un domāšanas rezultāti.

Psihodiagnostikas psihometriskie pamati.

Psiholoģiskās izmeklēšanas kvalitātes rādītāji.

Jebkuru psiholoģisko pētījumu vai diagnozi dažādu iemeslu dēļ var veikt labi vai slikti. Lai novērtētu diagnostikas procedūru kvalitāti, tiek izmantoti vairāki rādītāji:

Derīgums

Uzticamība

Uzticamība

Reprezentativitāte

Derīgums ir mērs, cik lielā mērā tests mēra to, ko tas ir paredzēts izmērīt. Piemēram, ja testa mērķis ir mērīt karavīra garīgo izturību, tad tam ir jāmēra tikai šis mainīgais, nevis cits. Šo prasību ne vienmēr ir iespējams realizēt 100%, bet uz to ir jātiecas. Ir dažādi derīguma noteikšanas veidi un veidi. Viens no visizplatītākajiem validitātes noteikšanas veidiem ir psiholoģiskā testa rādītāju salīdzināšana ar noteiktas kvalitātes (vai īpašību) ekspertu vērtējumiem priekšmetos.

Uzticamība ir mērīšanas procedūras stabilitāte. Tas atšķiras no derīguma situācijās, kad subjekts mēģina apzināti sagrozīt atbildi vai izmērāmais raksturlielums ir lineāri saistīts ar kādu citu raksturlielumu. Uzticamības paaugstināšanai tiek izmantoti dažādi paņēmieni, piemēram: papildu skalu ieviešana (viltus korekcija); jautājumu konstruēšana no superjautājumiem (parastu jautājumu kombinācija par uzvedību vai vēlmēm); no diagnozes neatkarīgu pazīmju izmantošana utt.

Uzticamība novērtē to punktu konsekvenci, kas iegūti par tiem pašiem priekšmetiem, atkārtoti pārbaudot ar to pašu testu vai līdzvērtīgu formu. Citiem vārdiem sakot, pārbaudē pēc noteikta laika ir jāatveido tas pats rezultāts fiksētā priekšmetu paraugā, ar nosacījumu, ka šajā laikā saskaņā ar teorētiskajām koncepcijām šis raksturlielums būtiski nemainās.

Ir trīs galvenās uzticamības novērtēšanas metodes:

Test-retest (test-retest reliability);

Paralēlā testēšana (ekvivalenta uzticamība);

Sadalīšana (saskaņa).

Pirmajā gadījumā atkārtotu testēšanu veic ar vienu un to pašu testu tiem pašiem subjektiem. Otrajā izmanto divas līdzvērtīgas pārbaudes formas. Lai novērtētu konsekvenci, testu sadala divās daļās un vienu grupu pārbauda ar divām testa daļām.

Derīgums un uzticamība ir saistīti viens ar otru kā mērīšanas subjekts un objekts.

Ja ticamība ir procedūras stabilitātes rādītājs attiecībā pret mērīšanas objektiem, tad derīgums ir objektu īpašību mērīšanas rezultātu stabilitātes raksturlielums, t.i. stabilitāte attiecībā pret mērīšanas priekšmetu. Mērīšanas procedūra ir uzticama, ja tā kaut ko atšķir no kaut kā, bet nav zināms, kas tieši atšķiras.

Uzticamība ir mērīšanas procedūras stabilitāte, jo īpaši pret viltošanu, t.i. tīša sagrozīšana.

Reprezentativitāte ir subjektu izlases spēja būt reprezentatīvam, t.i. pietiekami precīzi (adekvāti) atspoguļo pārbaudāmo subjektu kopas īpašības. Ja jums ir testu standarti, kas iegūti uz vidusskolēniem, tad tos nevar izmantot, lai novērtētu (piemēram, personības īpašības) pieaugušos, t.i. Pirms testa izmantošanas jums jāzina šādi punkti:

Šīs tehnikas uzticamība

Tās reprezentativitāte

Tās derīgums

Tās uzticamība

Vai metodika ir pielāgota mūsu sabiedrības mentalitātes īpatnībām?

Testa lietotājs, lai pārbaudītu datus, kas apliecina derīgumu, uzticamību, reprezentativitāti, izpratni un iespēju novērtēt testu savā pētījumā. Ja standartizācijas un testēšanas nosacījumi testa derīgumam un uzticamībai atšķiras no apstākļiem, kādos lietotājs strādā, tad lietotājam ir pienākums veikt papildu izpēti par testa derīgumu savām vajadzībām vai atteikties to izmantot.

Gennadii_M 2016. gada 17. martā, plkst. 14:52

Testēšana. Fundamentālā teorija

  • IT sistēmu testēšana
  • Apmācība

Man nesen bija intervija Middle QA par projektu, kas nepārprotami pārsniedz manas iespējas. Es pavadīju daudz laika kaut kam, ko nemaz nezināju, un maz laika atkārtoju vienkāršu teoriju, bet veltīgi.

Tālāk ir sniegti pamati, kas jāpārskata pirms intervijas praktikantam un junioram: testēšanas definīcija, kvalitāti, verifikācija/validācija, mērķi, posmi, testa plāns, pārbaudes plāna punkti, testa dizains, testa projektēšanas metodes, izsekojamības matrica, testa gadījums, kontrolsaraksts, defekts, kļūda/defekts/kļūme, kļūdu ziņojums, nopietnība salīdzinājumā ar prioritāti, testēšanas līmeņi, veidi/veidi, integrācijas testēšanas pieejas, testēšanas principi, statiskā un dinamiskā testēšana, izpētes/ad-hoc testēšana, prasības, kļūdu dzīves cikls, programmatūras izstrādes posmi, lēmumu tabula, qa/qc/testēšanas inženieris, savienojuma shēma.

Visi komentāri, labojumi un papildinājumi ir ļoti apsveicami.

Programmatūras testēšana- atbilstības pārbaude starp programmas faktisko un sagaidāmo uzvedību, kas veikta ar noteiktu testu kopumu, kas atlasīts noteiktā veidā. Plašākā nozīmē testēšana ir viens no kvalitātes kontroles paņēmieniem, kas ietver darba plānošanas (testa vadība), testēšanas plānošanas (testa izstrāde), testēšanas izpildes (testa izpilde) un rezultātu analīzes (testa analīze) aktivitātes.

Programmatūras kvalitāte ir programmatūras raksturlielumu kopums, kas saistīts ar tās spēju apmierināt noteiktās un paredzamās vajadzības.

Pārbaude ir sistēmas vai tās sastāvdaļu novērtēšanas process, lai noteiktu, vai pašreizējā attīstības posma rezultāti atbilst nosacījumiem, kas tika izveidoti šī posma sākumā. Tie. vai tiek ievēroti mūsu mērķi, termiņi un projekta izstrādes uzdevumi, kas noteikti kārtējā posma sākumā.
Validācija- tā ir noteikšana, vai izstrādātā programmatūra atbilst lietotāja vēlmēm un vajadzībām, un sistēmas prasībām.
Varat arī atrast citu interpretāciju:
Produkta atbilstības skaidrām prasībām (specifikācijām) novērtēšanas process ir verifikācija, bet vienlaikus produkta atbilstības lietotāju vēlmēm un prasībām novērtēšana ir validācija. Bieži vien varat atrast arī šādu šo jēdzienu definīciju:
Validācija — vai tā ir pareizā specifikācija?
Pārbaude — vai sistēma atbilst specifikācijai?

Pārbaudes mērķi
Palieliniet iespēju, ka testēšanai paredzētā lietojumprogramma darbosies pareizi visos apstākļos.
Palieliniet varbūtību, ka testējamā lietojumprogramma atbildīs visām aprakstītajām prasībām.
Jaunākās informācijas sniegšana par produkta pašreizējo stāvokli.

Pārbaudes posmi:
1. Produkta analīze
2. Darbs ar prasībām
3. Testēšanas stratēģijas izstrāde
un plānojot kvalitātes kontroles procedūras
4. Pārbaudes dokumentācijas izveide
5. Prototipu pārbaude
6. Pamatpārbaude
7. Stabilizācija
8. Darbība

Pārbaudes plāns- tas ir dokuments, kas apraksta visu testēšanas darbu apjomu, sākot no objekta apraksta, stratēģijas, grafika, testēšanas uzsākšanas un beigu kritērijiem, līdz procesā nepieciešamajām iekārtām, speciālajām zināšanām, kā arī riska novērtējumam ar to risināšanas iespējas.
Atbild uz jautājumiem:
Kas būtu jāpārbauda?
Ko tu pārbaudīsi?
Kā jūs pārbaudīsit?
Kad testēsi?
Testēšanas uzsākšanas kritēriji.
Pārbaudes pabeigšanas kritēriji.

Pārbaudes plāna galvenie punkti
IEEE 829 standartā ir uzskaitīti punkti, no kuriem (var) sastāvēt testa plānā:
a) pārbaudes plāna identifikators;
b) Ievads;
c) pārbaudes priekšmeti;
d) pārbaudāmās funkcijas;
e) funkcijas, kas nav jāpārbauda;
f) pieeja;
g) preces izturēšanas/neiespējami kritēriji;
h) apturēšanas kritēriji un prasības atsākšanai;
i) pārbaudes rezultāti;
j) testēšanas uzdevumi;
k) Vides vajadzības;
l) pienākumi;
m) personāla un apmācības vajadzības;
n) grafiks;
o) riski un neparedzēti gadījumi;
p) Apstiprinājumi.

Testa dizains– tas ir programmatūras testēšanas procesa posms, kurā tiek izstrādāti un izveidoti testēšanas scenāriji (testpiemēri) atbilstoši iepriekš definētiem kvalitātes kritērijiem un testēšanas mērķiem.
Par testa izstrādi atbildīgās lomas:
Testa analītiķis — nosaka “KO pārbaudīt?”
Testa dizainers — nosaka “KĀ pārbaudīt?”

Testa projektēšanas metodes

Ekvivalences sadalīšana (EP). Piemēram, ja jums ir derīgu vērtību diapazons no 1 līdz 10, jums ir jāizvēlas viena pareiza vērtība intervālā, piemēram, 5, un viena nepareiza vērtība ārpus intervāla, 0.

Robežvērtības analīze (BVA). Ja mēs ņemam piemēru iepriekš, mēs izvēlēsimies minimālo un maksimālo robežu (1 un 10) kā vērtības pozitīvai pārbaudei un vērtības, kas ir lielākas un mazākas par robežām (0 un 11). Robežvērtību analīzi var lietot laukiem, ierakstiem, failiem vai jebkura veida ierobežotām entītijām.

Cēlonis/sekas — CE. Parasti tā ir nosacījumu (iemeslu) kombināciju ievadīšana, lai iegūtu sistēmas atbildi (Efekts). Piemēram, jūs pārbaudāt iespēju pievienot klientu, izmantojot noteiktu displeju. Lai to izdarītu, jums būs jāievada vairāki lauki, piemēram, "Vārds", "Adrese", "Tālruņa numurs" un pēc tam noklikšķiniet uz pogas "Pievienot" - tas ir "Iemesls". Pēc noklikšķināšanas uz pogas “Pievienot”, sistēma pievieno klientu datu bāzei un parāda viņa numuru ekrānā - tas ir “Izmeklēšana”.

Uzminēšanas kļūda (EG). Tas ir tad, kad testētājs izmanto savas zināšanas par sistēmu un spēju interpretēt specifikāciju, lai "paredzētu", kādos ievades apstākļos sistēma var radīt kļūdu. Piemēram, specifikācijā teikts: "lietotājam jāievada kods". Testētājs domās: “Ko darīt, ja es neievadīšu kodu?”, “Ko darīt, ja ievadīšu nepareizu kodu? ", un tā tālāk. Šī ir kļūdas prognoze.

Izsmeļošā pārbaude (ET)- tas ir ārkārtējs gadījums. Izmantojot šo paņēmienu, jums jāpārbauda visas iespējamās ievades vērtību kombinācijas, un principā tam vajadzētu atrast visas problēmas. Praksē šīs metodes izmantošana nav iespējama, jo ir liels ievades vērtību skaits.

Pāru pārbaude ir metode testa datu kopu ģenerēšanai. Būtību var formulēt, piemēram, šādi: datu kopu veidošana, kurā katra pārbaudītā parametra katra pārbaudītā vērtība tiek apvienota vismaz vienu reizi ar visu pārējo pārbaudīto parametru katru pārbaudīto vērtību.

Teiksim, kāda vērtība (nodoklis) personai tiek aprēķināta, pamatojoties uz viņa dzimumu, vecumu un bērnu klātbūtni - mēs iegūstam trīs ievades parametrus, no kuriem katram kaut kādā veidā izvēlamies vērtības testiem. Piemēram: dzimums - vīrietis vai sieviete; vecums - līdz 25 gadiem, no 25 līdz 60 gadiem, virs 60 gadiem; bērnu piedzimšana - jā vai nē. Lai pārbaudītu aprēķinu pareizību, jūs, protams, varat iet cauri visām visu parametru vērtību kombinācijām:

stāvs vecums bērniem
1 vīrietis līdz 25 nav bērnu
2 sieviete līdz 25 nav bērnu
3 vīrietis 25-60 nav bērnu
4 sieviete 25-60 nav bērnu
5 vīrietis virs 60 nav bērnu
6 sieviete virs 60 nav bērnu
7 vīrietis līdz 25 Vai jums ir bērni
8 sieviete līdz 25 Vai jums ir bērni
9 vīrietis 25-60 Vai jums ir bērni
10 sieviete 25-60 Vai jums ir bērni
11 vīrietis virs 60 Vai jums ir bērni
12 sieviete virs 60 Vai jums ir bērni

Vai arī jūs varētu izlemt, ka mēs nevēlamies visu parametru vērtību kombinācijas ar visām, bet tikai vēlamies pārliecināties, ka mēs pārbaudām visus unikālos parametru vērtību pārus. Tas ir, piemēram, attiecībā uz dzimuma un vecuma parametriem, mēs vēlamies pārliecināties, ka mēs precīzi pārbaudām vīrieti, kas jaunāks par 25 gadiem, vīrieti no 25 līdz 60 gadiem, vīrieti pēc 60 gadiem, kā arī sievieti, kas jaunāka par 25 gadiem, sievieti no 25 līdz 60 un tā tālāk sieviete pēc 60. Un tieši tas pats visiem pārējiem parametru pāriem. Un šādā veidā mēs varam iegūt daudz mazākas vērtību kopas (tām ir visi vērtību pāri, lai gan dažas divas reizes):

stāvs vecums bērniem
1 vīrietis līdz 25 nav bērnu
2 sieviete līdz 25 Vai jums ir bērni
3 vīrietis 25-60 Vai jums ir bērni
4 sieviete 25-60 nav bērnu
5 vīrietis virs 60 nav bērnu
6 sieviete virs 60 Vai jums ir bērni

Šī pieeja ir aptuveni pāru testēšanas tehnikas būtība - mēs nepārbaudām visas visu vērtību kombinācijas, bet mēs pārbaudām visus vērtību pārus.

Izsekojamības matrica — prasību atbilstības matrica ir divdimensiju tabula, kas satur atbilstību starp produkta funkcionālajām prasībām un sagatavotajiem testa gadījumiem. Tabulas kolonnu virsraksti satur prasības, bet rindu virsraksti satur testēšanas scenārijus. Krustojumā ir atzīme, kas norāda, ka pašreizējās rindas pārbaudes gadījums attiecas uz pašreizējās kolonnas prasību.
Prasību atbilstības matricu izmanto kvalitātes nodrošināšanas inženieri, lai apstiprinātu produkta testa pārklājumu. MCT ir testa plāna neatņemama sastāvdaļa.

Testa gadījums ir artefakts, kas apraksta darbību kopumu, īpašus nosacījumus un parametrus, kas nepieciešami, lai pārbaudītu pārbaudāmās funkcijas vai tās daļas ieviešanu.
Piemērs:
Darbība Paredzamais rezultāts Testa rezultāts
(nokārtots/neizdevies/bloķēts)
Atvērt lapu “pieteikšanās” Tiek atvērta pieteikšanās lapa

Katrā testa gadījumā ir jābūt 3 daļām:
Priekšnosacījumi To darbību saraksts, kas nodrošina sistēmas stāvokli, kas ir piemērots pamata testēšanai. Vai arī nosacījumu saraksts, kuru izpilde norāda, ka sistēma ir stāvoklī, kas ir piemērots galvenās pārbaudes veikšanai.
Pārbaudes gadījuma apraksts Darbību saraksts, kas pārnes sistēmu no viena stāvokļa uz otru, lai iegūtu rezultātu, uz kura pamata var secināt, ka ieviešana atbilst prasībām
PostConditions To darbību saraksts, kas pārsūta sistēmu uz sākotnējo stāvokli (stāvoklis pirms testa - sākotnējais stāvoklis)
Testa skriptu veidi:
Pārbaudes gadījumi tiek sadalīti pozitīvos un negatīvos atkarībā no sagaidāmā rezultāta:
Pozitīvā testa gadījumā tiek izmantoti tikai pareizi dati un tiek pārbaudīts, vai lietojumprogramma pareizi izpildīja izsaukto funkciju.
Negatīvs testa gadījums darbojas gan ar pareiziem, gan nepareiziem datiem (vismaz 1 nepareizs parametrs), un tā mērķis ir pārbaudīt ārkārtas situācijas (tiek aktivizēti pārbaudītāji), kā arī pārbaudīt, vai lietojumprogrammas izsauktā funkcija netiek izpildīta, kad tiek aktivizēts validators.

Pārbaudes saraksts ir dokuments, kurā aprakstīts, kas ir jāpārbauda. Tajā pašā laikā kontrolsaraksts var būt ar pilnīgi dažādu detalizācijas pakāpi. Tas, cik detalizēts būs kontrolsaraksts, ir atkarīgs no ziņošanas prasībām, darbinieku zināšanu līmeņa par produktu un produkta sarežģītības.
Parasti kontrolsaraksts satur tikai darbības (soļus), bez sagaidāmā rezultāta. Kontrolsaraksts ir mazāk formalizēts nekā testa skripts. Ir lietderīgi to izmantot, ja testa skripti ir lieki. Kontrolsaraksti ir saistīti arī ar elastīgu pieeju testēšanai.

Defekts (aka bug) ir neatbilstība starp programmas izpildes faktisko rezultātu un paredzamo rezultātu. Defekti tiek atklāti programmatūras testēšanas stadijā, kad testētājs salīdzina programmas (komponenta vai dizaina) rezultātus ar prasību specifikācijā aprakstīto sagaidāmo rezultātu.

Kļūda- lietotāja kļūda, tas ir, viņš mēģina lietot programmu citādi.
Piemērs - ievada burtus laukos, kur jāievada cipari (vecums, preču daudzums utt.).
Kvalitatīva programma paredz šādas situācijas un parāda kļūdas ziņojumu ar sarkanu krustiņu.
Kļūda (defekts)- programmētāja (vai dizainera vai jebkura cita, kas piedalās izstrādē) kļūda, tas ir, kad kaut kas programmā nenotiek, kā plānots, un programma kļūst nekontrolējama. Piemēram, ja lietotāja ievade netiek nekādā veidā kontrolēta, kā rezultātā nepareizi dati izraisa avārijas vai citus “priekus” programmas darbībā. Vai arī programma iekšēji veidota tā, ka sākotnēji neatbilst tam, ko no tās sagaida.
Neveiksme- kļūme (un ne vienmēr aparatūras) kāda komponenta, visas programmas vai sistēmas darbībā. Tas ir, ir defekti, kas noved pie kļūmēm (defekts izraisīja kļūmi), un ir tādi, kas ne. Piemēram, lietotāja saskarnes defekti. Bet aparatūras kļūme, kurai nav nekāda sakara ar programmatūru, ir arī kļūme.

Kļūdu ziņojums ir dokuments, kurā aprakstīta situācija vai darbību secība, kas izraisīja nepareizu testa objekta darbību, norādot iemeslus un paredzamo rezultātu.
Cepure
Īss apraksts (kopsavilkums) Īss problēmas apraksts, skaidri norādot kļūdas cēloni un veidu.
Projekts Testējamā projekta nosaukums
Lietojumprogrammas komponents (Component) Testējamā produkta daļas vai funkcijas nosaukums
Versijas numurs Versija, kurā tika atrasta kļūda
Smaguma pakāpe Visizplatītākā piecu līmeņu sistēma defekta smaguma pakāpei ir:
S1 bloķētājs
S2 Kritisks
S3 Major
S4 Minor
S5 Triviāls
Prioritāte Defekta prioritāte:
P1 Augsts
P2 Vidēja
P3 Zems
Statuss Kļūdas statuss. Atkarīgs no izmantotās procedūras un kļūdas dzīves cikla (kļūdas darbplūsmas un dzīves cikla)

Autors (Autors) Kļūdu ziņojuma veidotājs
Piešķirts Problēmai piešķirtās personas vārds.
Vide
OS / servisa pakotne utt. / Browser + version /… Informācija par vidi, kurā kļūda tika atrasta: operētājsistēma, servisa pakotne, WEB testēšanai - pārlūkprogrammas nosaukums un versija utt.

Apraksts
Reproducēšanas darbības Darbības, ar kurām varat viegli reproducēt situāciju, kas izraisīja kļūdu.
Faktiskais rezultāts Rezultāts, kas iegūts pēc reproducēšanas darbību veikšanas
Paredzamais rezultāts Paredzamais pareizs rezultāts
Papildinājumi
Pielikums Žurnāla fails, ekrānuzņēmums vai jebkurš cits dokuments, kas var palīdzēt noskaidrot kļūdas cēloni vai norādīt problēmas risināšanas veidu

Smagums pret prioritāti
Smaguma pakāpe ir atribūts, kas raksturo defekta ietekmi uz lietojumprogrammas veiktspēju.
Prioritāte ir atribūts, kas norāda uzdevuma izpildes vai defekta novēršanas prioritāti. Var teikt, ka šis ir darba plānošanas vadītāja instruments. Jo augstāka prioritāte, jo ātrāk jānovērš defekts.
Smagumu atklāj testeris
Prioritāte – vadītājs, komandas vadītājs vai klients

Defekta smaguma pakāpe (smaguma pakāpe)

S1 bloķētājs
Bloķēšanas kļūda, kas padara lietojumprogrammu nederīgu, padarot neiespējamu turpmāku darbu ar testējamo sistēmu vai tās galvenajām funkcijām. Problēmas risināšana ir nepieciešama sistēmas turpmākai darbībai.

S2 Kritisks
Kritiska kļūda, nepareizi funkcionējoša atslēgas biznesa loģika, robs drošības sistēmā, problēma, kas izraisīja īslaicīgu servera avāriju vai padarīja kādu sistēmas daļu nedarbīgu, bez iespējas atrisināt problēmu, izmantojot citus ieejas punktus. Problēmas atrisināšana ir nepieciešama turpmākam darbam ar testējamās sistēmas galvenajām funkcijām.

S3 Major
Būtiska kļūda, daļa no galvenās biznesa loģikas nedarbojas pareizi. Kļūda nav kritiska vai ir iespējams strādāt ar pārbaudāmo funkciju, izmantojot citus ievades punktus.

S4 Minor
Neliela kļūda, kas nepārkāpj pārbaudāmās lietojumprogrammas daļas biznesa loģiku, acīmredzama lietotāja saskarnes problēma.

S5 Triviāls
Triviāla kļūda, kas neietekmē lietojumprogrammas biznesa loģiku, slikti atkārtojama problēma, kas ir grūti pamanāma, izmantojot lietotāja interfeisu, problēma ar trešo pušu bibliotēkām vai pakalpojumiem, problēma, kas nekādi neietekmē kopējo programmas kvalitāti. produkts.

Defektu prioritātes pakāpe (prioritāte)
P1 Augsts
Kļūda ir jānovērš pēc iespējas ātrāk, jo... tā klātbūtne ir būtiska projektam.
P2 Vidēja
Kļūda ir jālabo, tās klātbūtne nav kritiska, bet prasa obligātu risinājumu.
P3 Zems
Kļūda ir jānovērš, tās klātbūtne nav kritiska un tai nav nepieciešams steidzams risinājums.

Testēšanas līmeņi

1. Vienības pārbaude
Komponentu (vienību) testēšana pārbauda funkcionalitāti un meklē defektus lietojumprogrammas daļās, kuras ir pieejamas un kuras var pārbaudīt atsevišķi (programmu moduļi, objekti, klases, funkcijas utt.).

2. Integrācijas pārbaude
Sistēmas komponentu mijiedarbība tiek pārbaudīta pēc komponentu pārbaudes.

3. Sistēmas pārbaude
Sistēmas testēšanas galvenais mērķis ir pārbaudīt gan funkcionālās, gan nefunkcionālās prasības sistēmā kopumā. Tas identificē tādus defektus kā nepareiza sistēmas resursu izmantošana, neparedzētas lietotāja līmeņa datu kombinācijas, nesaderība ar vidi, neparedzētas lietošanas gadījumi, trūkstošas ​​vai nepareizas funkcionalitātes, lietošanas neērtības utt.

4. Darbības pārbaude (Release Testing).
Pat ja sistēma atbilst visām prasībām, ir svarīgi nodrošināt, lai tā atbilstu lietotāja vajadzībām un pildītu savu lomu savā darbības vidē, kā noteikts sistēmas biznesa modelī. Jāņem vērā, ka biznesa modelī var būt kļūdas. Tāpēc ir tik svarīgi veikt darbības testēšanu kā pēdējo validācijas soli. Turklāt testēšana darbības vidē ļauj identificēt nefunkcionālas problēmas, piemēram: konfliktus ar citām sistēmām, kas saistītas ar biznesa jomu vai programmatūrā un elektroniskajā vidē; nepietiekama sistēmas veiktspēja darbības vidē utt. Acīmredzot šādu lietu atrašana ieviešanas stadijā ir kritiska un dārga problēma. Tāpēc ir tik svarīgi veikt ne tikai verifikāciju, bet arī validāciju jau no pašiem agrīnākajiem programmatūras izstrādes posmiem.

5. Pieņemšanas pārbaude
Formāls testēšanas process, kas pārbauda, ​​vai sistēma atbilst prasībām, un tiek veikts, lai:
nosaka, vai sistēma atbilst pieņemšanas kritērijiem;
klienta vai citas pilnvarotās personas lēmuma pieņemšana, vai pieteikums tiek pieņemts vai nē.

Pārbaudes veidi/veidi

Funkcionālie testēšanas veidi

Funkcionālā pārbaude
GUI testēšana
Drošības un piekļuves kontroles pārbaude
Sadarbspējas pārbaude

Nefunkcionālie testēšanas veidi

Visu veidu veiktspējas pārbaudes:
o slodzes pārbaude (veiktspējas un slodzes pārbaude)
o Stresa testēšana
o Stabilitātes / uzticamības pārbaude
o apjoma pārbaude
Instalācijas pārbaude
Lietojamības pārbaude
Kļūmjpārlēces un atkopšanas pārbaude
Konfigurācijas pārbaude

Ar izmaiņām saistītie testēšanas veidi

Dūmu pārbaude
Regresijas pārbaude
Atkārtota pārbaude
Būvējuma verifikācijas tests
Saprāta pārbaude

Funkcionālā pārbaudeņem vērā iepriekš noteiktu darbību un balstās uz komponenta vai visas sistēmas funkcionalitātes specifikāciju analīzi.

GUI testēšana- interfeisa funkcionālā pārbaude par atbilstību prasībām - izmērs, fonts, krāsa, konsekventa uzvedība.

Drošības pārbaude ir testēšanas stratēģija, ko izmanto, lai pārbaudītu sistēmas drošību, kā arī analizētu riskus, kas saistīti ar holistiskas pieejas nodrošināšanu lietojumprogrammas aizsardzībai, hakeru uzbrukumiem, vīrusiem, nesankcionētu piekļuvi konfidenciāliem datiem.

Sadarbspējas pārbaude ir funkcionālā testēšana, kas pārbauda lietojumprogrammas spēju mijiedarboties ar vienu vai vairākiem komponentiem vai sistēmām un ietver saderības testēšanu un integrācijas testēšanu

Stresa testēšana- šī ir automatizēta testēšana, kas simulē noteikta skaita biznesa lietotāju darbu pie kāda kopīga (viņu koplietota) resursa.

Stresa testēšanaļauj pārbaudīt, cik efektīva ir lietojumprogramma un sistēma kopumā, kā arī novērtēt sistēmas spēju atjaunoties, t.i. atgriezties normālā stāvoklī pēc stresa pārtraukšanas. Stress šajā kontekstā var būt darbību intensitātes palielināšanās līdz ļoti augstām vērtībām vai ārkārtas izmaiņas servera konfigurācijā. Tāpat viens no stresa testēšanas uzdevumiem var būt veiktspējas pasliktināšanās novērtēšana, tāpēc stresa testu mērķi var pārklāties ar veiktspējas testēšanas mērķiem.

Skaļuma pārbaude. Apjoma testēšanas mērķis ir iegūt veiktspējas novērtējumu, palielinoties datu apjomam lietojumprogrammu datubāzē

Stabilitātes/uzticamības pārbaude. Stabilitātes (uzticamības) testēšanas uzdevums ir pārbaudīt aplikācijas funkcionalitāti ilgstošas ​​(daudzu stundu) testēšanas laikā ar vidējo slodzes līmeni.

Instalācijas pārbaude kuru mērķis ir pārbaudīt veiksmīgu instalēšanu un konfigurāciju, kā arī programmatūras atjaunināšanu vai atinstalēšanu.

Lietojamības pārbaude ir testēšanas metode, kuras mērķis ir noteikt izstrādātā produkta lietojamības, apgūstamības, saprotamības un pievilcības pakāpi noteikto apstākļu kontekstā. Tas ietver arī:
User eXperience (UX) ir sajūta, ko lietotājs izjūt, izmantojot digitālo produktu, savukārt lietotāja interfeiss ir rīks, kas ļauj mijiedarboties ar lietotāja un tīmekļa resursiem.

Kļūmjpārlēces un atkopšanas pārbaude pārbauda pārbaudāmo produktu, ņemot vērā tā spēju izturēt un veiksmīgi atgūties no iespējamām kļūmēm, kas radušās programmatūras kļūdu, aparatūras kļūmju vai sakaru problēmu (piemēram, tīkla kļūmes) dēļ. Šāda veida testēšanas mērķis ir pārbaudīt atkopšanas sistēmas (vai sistēmas, kas dublē galveno funkcionalitāti), kas atteices gadījumā nodrošinās testējamā produkta datu drošību un integritāti.

Konfigurācijas pārbaude- īpašs testēšanas veids, kura mērķis ir pārbaudīt programmatūras darbību dažādās sistēmas konfigurācijās (deklarētās platformas, atbalstītie draiveri, dažādas datora konfigurācijas utt.)

Dūmu testēšana tiek uzskatīta par īsu testu ciklu, kas tiek veikts, lai pārliecinātos, ka pēc koda izveides (jauna vai fiksēta) instalētā lietojumprogramma tiek startēta un pilda pamatfunkcijas.

Regresijas pārbaude ir testēšanas veids, kura mērķis ir pārbaudīt lietojumprogrammā vai vidē veiktās izmaiņas (defekta novēršana, koda sapludināšana, migrēšana uz citu operētājsistēmu, datubāzi, tīmekļa serveri vai lietojumprogrammu serveri), lai apstiprinātu faktu, ka iepriekš esošā funkcionalitāte darbojas, kā paredzēts. pirms tam. Regresijas testi var būt gan funkcionāli, gan nefunkcionāli testi.

Atkārtota pārbaude- testēšana, kuras laikā tiek izpildīti testa skripti, kas identificēja kļūdas pēdējā palaišanas laikā, lai apstiprinātu šo kļūdu labošanas panākumus.
Kāda ir atšķirība starp regresijas testēšanu un atkārtotu testēšanu?
Atkārtota pārbaude — kļūdu labojumi tiek pārbaudīti
Regresijas testēšana – pārbauda, ​​vai kļūdu labojumi, kā arī jebkādas izmaiņas lietojumprogrammas kodā neietekmē citus programmatūras moduļus un nerada jaunas kļūdas.

Montāžas testēšana vai konstrukcijas verifikācijas tests- testēšana, kuras mērķis ir noteikt izlaistās versijas atbilstību kvalitātes kritērijiem, lai sāktu testēšanu. Savu mērķu ziņā tas ir līdzīgs dūmu pārbaudei, kura mērķis ir pieņemt jaunu versiju turpmākai pārbaudei vai darbībai. Tas var iekļūt dziļāk atkarībā no izlaistās versijas kvalitātes prasībām.

Sanitārā pārbaude- šī ir šauri fokusēta pārbaude, kas ir pietiekama, lai pierādītu, ka konkrēta funkcija darbojas atbilstoši specifikācijā norādītajām prasībām. Tā ir regresijas pārbaudes apakškopa. Izmanto, lai noteiktu noteiktas lietojumprogrammas daļas veiktspēju pēc tam, kad tajā vai vidē veiktas izmaiņas. Parasti veic manuāli.

Integrācijas testēšanas pieejas:
Integrācija no apakšas uz augšu
Visi zema līmeņa moduļi, procedūras vai funkcijas tiek apkopoti kopā un pēc tam pārbaudīti. Pēc tam tiek samontēti nākamā līmeņa moduļi integrācijas testēšanai. Šī pieeja tiek uzskatīta par noderīgu, ja ir gatavi visi vai gandrīz visi izstrādātā līmeņa moduļi. Šī pieeja palīdz arī noteikt lietojumprogrammas gatavības līmeni, pamatojoties uz testēšanas rezultātiem.
Integrācija no augšas uz leju
Vispirms tiek pārbaudīti visi augsta līmeņa moduļi un pakāpeniski pa vienam tiek pievienoti zema līmeņa moduļi. Visi zemākā līmeņa moduļi tiek simulēti kā stubs ar līdzīgu funkcionalitāti, pēc tam, kad tie ir gatavi, tie tiek aizstāti ar reāliem aktīvajiem komponentiem. Tādā veidā mēs pārbaudām no augšas uz leju.
Lielais sprādziens (“Lielā sprādziena” integrācija)
Visi vai gandrīz visi izstrādātie moduļi tiek samontēti kopā kā pilnīga sistēma vai tās galvenā daļa, un pēc tam tiek veikta integrācijas pārbaude. Šī pieeja ir ļoti laba laika taupīšanai. Taču, ja testa gadījumi un to rezultāti netiks fiksēti pareizi, tad pats integrācijas process būs ļoti sarežģīts, kas kļūs par šķērsli testēšanas komandai integrācijas testēšanas galvenā mērķa sasniegšanā.

Pārbaudes principi

1. princips– Pārbaude parāda defektu esamību
Pārbaude var parādīt, ka ir defekti, bet nevar pierādīt, ka to nav. Testēšana samazina programmatūras defektu iespējamību, taču, pat ja defekti netiek konstatēti, tas nepierāda tās pareizību.

2. princips– Pilnīga pārbaude nav iespējama
Pilnīga pārbaude, izmantojot visas ievades un priekšnosacījumu kombinācijas, ir fiziski neiespējama, izņemot triviālus gadījumus. Izsmeļošas pārbaudes vietā ir jāizmanto riska analīze un prioritāšu noteikšana, lai labāk koncentrētu testēšanas centienus.

3. princips- Agrīna pārbaude
Lai pēc iespējas agrāk atklātu defektus, testēšanas aktivitātes jāuzsāk pēc iespējas agrāk programmatūras vai sistēmas izstrādes dzīves ciklā, un tām jābūt vērstām uz konkrētiem mērķiem.

4. princips– Klasterizācijas defekti
Testēšanas centieni jākoncentrē proporcionāli paredzamajam un vēlāk faktiskajam moduļa defektu blīvumam. Parasti lielākā daļa defektu, kas atklāti testēšanas laikā vai kas izraisīja lielāko daļu sistēmas kļūmju, ir ietverti nelielā skaitā moduļu.

5. princips– Pesticīdu paradokss
Ja vienus un tos pašus testus izpilda atkal un atkal, galu galā šis testa gadījumu kopums vairs neatradīs jaunus defektus. Lai pārvarētu šo "pesticīdu paradoksu", testa gadījumi ir regulāri jāpārskata un jāpielāgo, jaunajiem testiem jābūt visaptverošiem, lai aptvertu visus programmatūras komponentus,
vai sistēmu, un atrodiet pēc iespējas vairāk defektu.

6. princips– Testēšana ir atkarīga no koncepcijas
Pārbaude tiek veikta atšķirīgi atkarībā no konteksta. Piemēram, drošībai svarīga programmatūra tiek pārbaudīta citādi nekā e-komercijas vietne.
7. princips– Kļūdu neesamības kļūda
Defektu atrašana un novēršana nepalīdzēs, ja izveidotā sistēma neatbilst lietotājam un neatbilst viņa vēlmēm un vajadzībām.

Statiskā un dinamiskā pārbaude
Statiskā pārbaude atšķiras no dinamiskās testēšanas ar to, ka tā tiek veikta, nepalaižot produkta kodu. Testēšana tiek veikta, analizējot programmas kodu (koda pārskatīšanu) vai apkopoto kodu. Analīzi var veikt manuāli vai izmantojot īpašus instrumentus. Analīzes mērķis ir savlaicīgi identificēt kļūdas un iespējamās problēmas produktā. Statiskā pārbaude ietver arī testēšanas specifikācijas un citu dokumentāciju.

Izpētes/ad-hoc testēšana
Vienkāršākā izpētes testēšanas definīcija ir testu izstrāde un izpilde vienlaikus. Kas ir pretējs scenārija pieejai (ar tās iepriekš definētām manuālām vai automatizētām testēšanas procedūrām). Izpētes testi, atšķirībā no scenāriju testiem, nav iepriekš noteikti un netiek izpildīti tieši tā, kā plānots.

Atšķirība starp ad hoc un pētniecisko testēšanu ir tāda, ka teorētiski ad hoc testēšanu var veikt ikviens, savukārt izpētes testēšanai ir nepieciešamas prasmes un zināšanas par noteiktām metodēm. Lūdzu, ņemiet vērā, ka noteiktas metodes nav tikai testēšanas metodes.

Prasības ir specifikācija (apraksts), kas būtu jāīsteno.
Prasībās ir aprakstīts, kas ir jāīsteno, neprecizējot risinājuma tehnisko pusi. Kas, nevis kā.

Prasības Prasības:
Pareizība
Nepārprotamība
Prasību kopuma pilnība
Prasību kopuma konsekvence
Pārbaudāmība (pārbaudāmība)
Izsekojamība
Saprotamība

Bug dzīves cikls

Programmatūras izstrādes posmi- šie ir posmi, kurus programmatūras izstrādes komandas iziet, pirms programma kļūst pieejama plašam lietotāju lokam. Programmatūras izstrāde sākas ar sākotnējo izstrādes posmu (pirmsalfa stadiju) un turpinās ar posmiem, kuros produkts tiek pilnveidots un modernizēts. Šī procesa pēdējais posms ir programmatūras galīgās versijas izlaišana tirgū (“vispārēji pieejamais laidiens”).

Programmatūras produkts iziet šādus posmus:
projekta prasību analīze;
dizains;
īstenošana;
produktu testēšana;
īstenošana un atbalsts.

Katram programmatūras izstrādes posmam tiek piešķirts konkrēts sērijas numurs. Tāpat katram posmam ir savs nosaukums, kas raksturo produkta gatavību šajā posmā.

Programmatūras izstrādes dzīves cikls:
Pirms alfa
Alfa
Beta
Atbrīvošanas kandidāts
Atbrīvot
Pēc izlaišanas

Lēmumu tabula– lielisks instruments sarežģītu biznesa prasību organizēšanai, kas jāievieš produktā. Lēmumu tabulās ir parādīts nosacījumu kopums, kuru vienlaicīgai izpildei vajadzētu izraisīt noteiktu darbību.

3.2. Pārbaudes metožu uzticamība

Psihodiagnostisko procedūru un paņēmienu pārveide par uzticamu zinātnes un prakses rīku ir atkarīga no daudzu speciālistu pūlēm psihometriskā atkļūdošanā, izstrādājot testus, kas atbilst psihometrijas pamatprasībām: uzticamība, derīgums, standartizācija. Psihodiagnostikas metožu testēšanas un uzticamības noteikšanas pamatprincipi, uzbūve un validācija ir aplūkoti vairākos speciālos psihodiagnostikas darbos (A. Anastasi, A. Bodaļsi, V. Stolins, A. Šmeļevs, K. Gurevičs, V. Meļņikovs). utt.). Šajā apmācībā aprakstīsim psihodiagnostiskās pārbaudes veikšanas pamatjēdzienus un principus, kuru zināšanas ir neaizstājams nosacījums praktiskā psihologa profesionālās kvalifikācijas iegūšanai.

Psihodiagnostika kā zinātnes disciplīna ietver trīs psiholoģisko zināšanu jomas:


  • priekšmeta jomapsiholoģija, kas pēta šīs garīgās parādības;

  • psihometrija– zinātne par individuālo atšķirību un diagnostisko mainīgo mērīšanu;

  • praktiska izmantošanapsiholoģiskās zināšanas, lai nodrošinātu atbilstošu psiholoģisko ietekmi un palīdzētu cilvēkiem atrisināt viņu problēmas.
Psihodiagnostikas metodoloģiskais pamats ir psihometrija. Tieši šī zinātne izstrādā tehnoloģiju specifisku psihodiagnostikas metožu izveidei un nosaka metodoloģiju, kā nodrošināt tām zinātniskās prasības:

  • uzticamība– testa daļu iekšējā konsekvence un rezultātu reproducējamība atkārtotas pārbaudes laikā;

  • derīgums– pārbaužu rezultātos atspoguļojums tieši tam īpašumam, kuram paredzēts diagnosticēt;

  • uzticamība- testa aizsardzība no ietekmes uz testa kārtotāja vēlmi tos mainīt vēlamajā virzienā;

  • reprezentativitāte- masu pārbaudes rezultātu normu esamība populācijā, kurai tests ir paredzēts, ļaujot novērtēt novirzes pakāpi no jebkura atsevišķa rādītāja vidējām vērtībām.

Šīs psihometriskās prasības attiecas uz dažādām testu grupām, vislielākā mērā uz objektīviem testiem un personības anketām un vismazāk uz projektīvām metodēm.

Objektīvs psiholoģisko paņēmienu un testu novērtējums nozīmē to ticamības noteikšanu. Psihometrijā termins "uzticamība" vienmēr attiecas uz to pašu priekšmetu rezultātu konsekvenci.

Cik noderīgs ir šis tests? Vai tas tiešām pilda savas funkcijas? Šie jautājumi var izraisīt un dažreiz izraisa ilgstošas, neauglīgas diskusijas. Aizspriedumi, subjektīvi secinājumi un personīgie aizspriedumi noved, kā uzskata A. Anastasi, no vienas puses, pie konkrēta testa spēju pārvērtēšanas, no otras puses, pie tā neatlaidīgas noraidīšanas. Vienīgais veids, kā atbildēt uz šādiem jautājumiem, ir empīriskā pārbaude. Objektīvs novērtējums psiholoģiskie testi pirmkārt nozīmē to ticamības un derīguma noteikšanu konkrētās situācijās.
^ Testa uzticamība ir konsekventi rezultāti, kas iegūti no tiem pašiem priekšmetiem, atkārtoti pārbaudot ar to pašu testu vai līdzvērtīgu formu.
Ja bērna IQ pirmdien ir 110 un piektdien 80, tad ir skaidrs, ka šo rādītāju diez vai var uztvert ar pārliecību. Tāpat, ja indivīds pareizi identificēja 40 vārdus 50 vārdu sērijā un 20 citā uzskatītā līdzvērtīgā virknē, tad nevienu no šiem rādītājiem nevar uzskatīt par viņa verbālās izpratnes mērauklu. Protams, abos piemēros ir iespējams, ka tikai viens no diviem rādītājiem ir kļūdains, taču tikai turpmāka pārbaude var to apstiprināt; No sniegtajiem datiem izriet tikai tas, ka rādītāji kopā nevar būt pareizi.

Pirms psiholoģiskā testa pieejamības sabiedrībai ir jāveic rūpīga, objektīva tā ticamības pārbaude. Uzticamību var pārbaudīt, ņemot vērā izmaiņas laika gaitā, konkrētu uzdevumu vai testa paraugu izvēli, eksperimentētāja vai testa procesora personību un citus testēšanas aspektus. Ir ļoti svarīgi precīzi norādīt uzticamības veidu un veidu, kā tas tiek noteikts, jo viens un tas pats tests var atšķirties dažādos aspektos. Ir arī ieteicams iegūt informāciju par to personu skaitu un īpašībām, kurām tika pārbaudīta testa ticamība.

Šāda informācija testa lietotājam ļaus izlemt, cik uzticams tests ir grupai, kurai viņš plāno to piemērot.

Vispilnīgāko skaidrojumu par pārbaudes metožu ticamību sniedz A. Anastasi. Uzticamība attiecas uz testa rezultātu konsekvenci, kas iegūta, ja to atkārto uz tiem pašiem priekšmetiem dažādos laika punktos, izmantojot dažādas līdzvērtīgu uzdevumu kopas vai mainot citus eksāmena nosacījumus. Aprēķins ir balstīts uz uzticamību mērījumu kļūdas, kas kalpo, lai norādītu iespējamās mērāmā lieluma svārstību robežas, kas rodas ārēju nejaušības faktoru ietekmē. Visplašākajā nozīmē uzticamība attiecas uz to, cik lielā mērā individuālās atšķirības testu rezultātos ir “patiesas” un cik lielā mērā tās var attiecināt uz nejaušām kļūdām. Ja mēs to tulkojam īpašo terminu valodā, tad testa ticamības mērīšana ļauj novērtēt testa rādītāju kopējās izkliedes vērtību, kas ir kļūdu dispersija. Tomēr jautājums ir par to, ko uzskatīt par kļūdu dispersiju. Tie paši faktori, kas ir sveši attiecībā uz dažām problēmām, jau tiek uzskatīti par “patieso” atšķirību avotiem, risinot citas problēmas. Piemēram, ja mūs interesē garastāvokļa svārstības, tad emocionālā stāvokļa pārbaudes rezultātu ikdienas izmaiņas varētu būt saistītas ar testa mērķi un līdz ar to arī ar rezultātu patieso dispersiju. Bet, ja tests ir paredzēts stabilāku personības īpašību noteikšanai, tad tās pašas ikdienas svārstības var attiecināt uz kļūdu dispersiju.

Svarīgi ir tas, ka jebkuras izmaiņas apstākļos, kādos tiek veikts tests, ja tās nav saistītas ar tā mērķi, palielinās kļūdu dispersija. Tāpēc, ievērojot vienotus testēšanas nosacījumus (kontrolējot vispārējo vidi, laika ierobežojumus, norādījumus subjektam, kontaktu ar viņu un citus līdzīgus faktorus), eksperimentētājs samazina kļūdu dispersiju un palielina testa ticamību. Bet pat optimālos apstākļos neviens tests nav absolūti uzticams instruments. Tāpēc standarta testa datu komplektā jāietver ticamības mērs. Šis pasākums raksturo testu, kad tas tiek ievadīts standarta apstākļos un tiek ievadīts subjektiem, kas ir līdzīgi tiem, kuri piedalījās normatīvajā izlasē. Tāpēc ir jāsniedz informācija arī par šo paraugu.

K. M. Gurevičs definē uzticamību kā “ārkārtīgi sarežģītu un daudzšķautņainu jēdzienu, kura viena no galvenajām funkcijām ir novērtēt testa veiktspējas rādītāju konsekvenci” [Gurevičs, 1981].

Principā mēs varam teikt, ka ticamībai ir jāattaisno mērījumu kļūda — tai jāparāda, cik lielu daļu mērījumu mainīguma rada kļūda. Ir vairāki galvenie faktori, kas nosaka uzticamības līmeni. Tādējādi uzticamībai vienmēr ir tendence palielināties, ja testēšanas procedūras nosacījumi tiek uzturēti nemainīgi, jo tas samazina izmērītā parametra mainīguma kļūdu. Tajā pašā laikā mērķu daudzveidība, problēmas sarežģītība un situāciju mainīgums mēdz palielināt mērījumu kļūdu, tādējādi samazinot uzticamību.

Ir tik daudz testu ticamības šķirņu, cik ir apstākļu, kas ietekmē testa rezultātus, tāpēc visi šādi apstākļi var izrādīties neatbilstoši mērķim, un tad

to izraisītā dispersija jāiekļauj kļūdu dispersijā. Tomēr tikai daži uzticamības veidi atrod praktisku pielietojumu. Tā kā visi ticamības veidi atspoguļo divu neatkarīgi iegūto indikatoru sēriju konsekvences vai konsekvences pakāpi, to mērs var būt korelācijas koeficients. Specializētāka diskusija par korelāciju ar detalizētu skaitļošanas procedūru aprakstu ir sniegta statistikas mācību grāmatās skolotājiem un psihologiem (V. Avanesovs, A. Gusevs, Ch. Izmailovs, M. Mihaļevska uc).

Praksē testu ticamības novērtēšanai tiek izmantotas trīs galvenās metodes:

1) atkārtota pārbaude;

2) paralēlā testēšana;

3) sadalīšanas metode.

Apskatīsim katru no tiem atsevišķi.

^ Atkārtota pārbaude Tā ir viena no galvenajām uzticamības mērīšanas metodēm. Atkārtoti

subjektu izlases pārbaude tiek veikta ar vienu un to pašu testu pēc noteikta laika intervāla tādos pašos apstākļos. Parasti tiek saukta atkārtota pārbaude atkārtoti pārbaudīt, un šādā veidā mērīta uzticamība ir testa un atkārtotas pārbaudes uzticamība. Testa atkārtotas pārbaudes uzticamības novērtēšanas shēma izskatās šādi:

Šajā gadījumā par ticamības indeksu tiek ņemts korelācijas koeficients starp divu testu rezultātiem.

Atkārtotai testēšanas metodei ir gan priekšrocības, gan trūkumi. Priekšrocības ietver ticamības koeficienta noteikšanas dabiskumu un vienkāršību. Trūkumi ietver nenoteiktību, izvēloties intervālu starp diviem mērījumiem. Īslaicīgas nenoteiktības rašanās ir saistīta ar to, ka atkārtotā pārbaude atšķiras no sākotnējās. Priekšmeti jau ir iepazinušies ar kontroldarba saturu, atceras savas sākotnējās atbildes un vadās pēc tām, atkārtojot kontroldarbu. Tāpēc atkārtotas testēšanas laikā bieži novērojama vai nu “pielāgošanās” sākotnējiem rezultātiem, vai arī negatīvisma rezultātā “jaunu” rezultātu demonstrēšana. Lai no tā izvairītos, testa rokasgrāmatā norādot testa atkārtotas pārbaudes ticamību, jānorāda, kādam laika intervālam tas atbilst. Sakarā ar to, ka testa atkārtotas pārbaudes ticamība samazinās, palielinoties laika intervālam, visdrošākie ir augsti ticamības koeficienti, kas iegūti ar nepārprotami lieliem intervāliem starp testiem. Nepietiekami augsti ticamības koeficienti var būt suboptimālas laika intervālu noteikšanas sekas.
^ Paralēlā pārbaude Šajā gadījumā tiek organizēti vairāki mērījumi, izmantojot paralēlus vai līdzvērtīgus testus. Paralēli testi ir testi, kas mēra vienu un to pašu garīgo īpašumu ar tādu pašu kļūdu. Šajā gadījumā vienas un tās pašas personas veic vairākas viena un tā paša testa versijas vai līdzvērtīgus testus. Parasti šāda veida ticamības praktiskā izmantošana ir saistīta ar ievērojamām grūtībām, jo ​​ir ārkārtīgi grūti izveidot vairākas viena testa versijas tā, lai subjekts nevarētu noteikt to psiholoģisko viendabīgumu. Un apmācības kropļojošā ietekme šajā gadījumā nav pilnībā novērsta. Turklāt rodas jautājums: vai alternatīvi uzticamības veidi ir testa ticamības raksturlielumi, nevis testa ekvivalences parametri? Galu galā, ja viena veida konstantos apstākļos tiek veiktas divas testēšanas formas, tad, visticamāk, tiek pētīti abu testēšanas veidu ekvivalences rādītāji, nevis pašu testu ticamības rādītāji. Mērījumu kļūdu šajā gadījumā nosaka testa izpildes svārstības, nevis testa struktūras svārstības.

Shēma paralēlo testu izmantošanai uzticamības mērīšanai ir šāda:

Tiek izsaukts korelācijas koeficients, kas aprēķināts starp diviem testiem līdzvērtīga uzticamība.

^ Šķelšanas metode Tā ir paralēlās testēšanas metodes izstrāde, un tā ir balstīta uz pieņēmumu par paralēlismu ne tikai atsevišķām testa formām, bet arī atsevišķiem uzdevumiem viena testa ietvaros. Šis ir viens no vienkāršākajiem testa testiem, kad tiek aprēķināts korelācijas koeficients starp tā pusēm. Kā sadalīt testu divās daļās, lai abas puses varētu salāgot uz viena vai otra konkrēta pamata? Visbiežāk testa uzdevumi tiek sadalīti pāra un nepāra, kas ļauj zināmā mērā novērst iespējamos trūkumus. Šāda veida uzticamības galvenā priekšrocība ir testa rezultātu neatkarība no tādiem darbības elementiem kā attīstība, apmācība, prakse, nogurums utt. Sadalot testu divās daļās, uzticamības indekss tiek aprēķināts, izmantojot Spīrmena-Brauna formulu, kas to ierosināja neatkarīgi viens no otra. Viņu raksti tika publicēti tajā pašā psiholoģiskā žurnāla numurā ar secinājumiem un formulām [Avanesovs , 1982]. Viņu formulā

R(X, 0=2 R.J.\ + R, g
kur R ir testa divu daļu korelācijas koeficients. Par ticamības indeksa koeficientu tiek uzskatīts visu testa priekšmetu korelācijas koeficienta vidējais modulis jeb vidējais determinācijas koeficients.

Līdz šim mēs esam apskatījuši trīs empīriskās metodes testa ticamības novērtēšanai: atkārtota pārbaude ar to pašu testu, atkārtota pārbaude ar paralēlu testa formu un testa sadalīšana.

Kura no šīm metodēm nodrošina patiesu testa ticamības novērtējumu? Kuru metodi vajadzētu izmantot? Atbilde uz šo jautājumu ir atkarīga no personīgās izvēles un pētījuma mērķiem.

Izmantojot atkārtotās testēšanas metodi, mēs iegūstam rezultātu stabilitātes pakāpes novērtējumu laikā un atkarībā no testēšanas apstākļiem. Tāpēc tiek saukts arī testa atkārtotas pārbaudes ticamības koeficients stabilitātes koeficients vai stabilitāte pārbaude. Izmantojot paralēlo formu metodi un sadalīšanas metodi, tiek novērtēta testa daļu savstarpējās konsekvences pakāpe. Tāpēc ticamības koeficienti, kas iegūti ar šīm divām metodēm, tiek interpretēti kā novirzīti un viendabīgums, viendabīgums testiem.

Papildus stabilitātes un viendabīguma rādītājiem R. B. Kattels uzskata par nepieciešamu ņemt vērā arī rādītāju pieļaujamsmu (pārnesamība). Tas ir novērtējums par testa spēju saglabāt mērījumu precizitāti dažādos paraugos, subkultūrās un populācijās. Stabilitāte, viendabīgums un pārnesamība kopā veido kompleksu uzticamības īpašību, ko R. B. Cattell sauc noturība (konsekvenci) un definē to kā “pakāpi, kādā tests turpina prognozēt to, ko tas iepriekš prognozēja, neskatoties uz izmaiņām (noteiktās robežās): a) apmēru, kādā tests tiek piemērots; b) nosacījumus, kādos tas tika izmantots; c) parauga sastāvs, kurā tas tiek lietots.

Visbeidzot, pastāv uzticamības veids, kas ir tieši saistīts ar personas, kas veic testu, uzticamību. Personas, kas veic testu, uzticamības novērtējums tiek iegūts, neatkarīgi simulējot testu ar diviem dažādiem eksperimentētājiem.

Testa rezultātu ticamība ir atkarīga ne tikai no paša testa ticamības un tā veikšanas procedūras. Būtisks faktors, kas ietekmē datu interpretācijas rezultātus, ir konkrētas izlases specifika. Par izlases nozīmīgākajiem raksturlielumiem no šī viedokļa būtu jāatzīst sociāli psiholoģiskā viendabība dažādos parametros; tiek ņemts vērā arī vecums un dzimums.

A.G. Šmeļevs ierosina veikt darbību secību, pārbaudot uzticamību, šādi [Vispārējā psihodiagnostika, 1987]:

1. Uzziniet, vai ir dati par izmantotā testa ticamību, par kādu populāciju un kādā diagnostikas situācijā tas tika pārbaudīts. Ja pārbaude netika veikta vai ja jaunās populācijas iezīmes un situācijas ir skaidri noteiktas, atkārtoti pārbaudiet uzticamību, ņemot vērā tālāk norādītās iespējas.

2. Ja iespējas atļauj, atkārtoti pārbaudiet visu standartizācijas izlasi un aprēķiniet visus dotos koeficientus gan visam testam, gan atsevišķām vienībām. Iegūto koeficientu analīze palīdzēs saprast, cik niecīga ir mērījumu kļūda.

3. Ja iespējas ir ierobežotas, atkārtojiet testēšanu tikai daļai izlases (vismaz 30 subjekti), manuāli aprēķiniet ranga korelāciju, lai novērtētu iekšējo.

visa testa konsistence (ar sadalīšanas metodi) un stabilitāte.

Protams, aplūkotie psihodiagnostikas jēdzieni ir tās svarīgākie atribūti. Tomēr augsti uzticamības rādītāji paši par sevi nenosaka testa praktisko vērtību. Vadošais faktors, kas ļauj izmērīt psiholoģiskās pārbaudes mērķa rezultātus, ir derīgums.

*Pārbaudes ticamība un derīgums raksturo pētījuma atbilstību formāliem kritērijiem, kas nosaka kvalitāti un piemērotību lietošanai praksē.

Kas ir uzticamība

Testa ticamības testēšanas laikā tiek novērtēta atkārtotas pārbaudes laikā iegūto rezultātu konsekvence. Datu neatbilstībām nevajadzētu būt vai tām jābūt nenozīmīgām. Pretējā gadījumā nav iespējams ar pārliecību izturēties pret testa rezultātiem.

Testa ticamība ir kritērijs, kas norāda, ka šādas testu īpašības tiek uzskatītas par būtiskām:

  • pētījumā iegūto rezultātu reproducējamība;
  • precizitātes pakāpe vai saistītie instrumenti;
  • rezultātu ilgtspējība noteiktā laika periodā.

Uzticamības interpretācijā var izdalīt šādas galvenās sastāvdaļas:

  • mērinstrumenta uzticamība (proti, testa uzdevuma lasītprasme un objektivitāte), ko var novērtēt, aprēķinot atbilstošo koeficientu;
  • pētāmā raksturlieluma stabilitāte ilgā laika periodā, kā arī tās svārstību paredzamība un vienmērīgums;
  • rezultāta objektivitāte (tas ir, tā neatkarība no pētnieka personīgajām vēlmēm).

Uzticamības faktori

Uzticamības pakāpi var ietekmēt vairāki negatīvi faktori, no kuriem nozīmīgākie ir šādi:

  • metodikas nepilnīgums (nepareizi vai neprecīzi norādījumi, neskaidrs uzdevumu formulējums);
  • īslaicīga nestabilitāte vai pastāvīgas pētāmā indikatora vērtību svārstības;
  • vides, kurā tiek veikti sākotnējie un turpmākie pētījumi, neatbilstība;
  • pētnieka uzvedības maiņa, kā arī subjekta stāvokļa nestabilitāte;
  • subjektīva pieeja, novērtējot testa rezultātus.

Testa ticamības novērtēšanas metodes

Lai noteiktu testa ticamību, var izmantot šādas metodes.

Atkārtotas pārbaudes metode ir viena no visizplatītākajām. Tas ļauj noteikt korelācijas pakāpi starp pētījumu rezultātiem, kā arī laiku, kurā tie tika veikti. Šī tehnika ir vienkārša un efektīva. Tomēr, kā likums, atkārtotas pārbaudes izraisa subjektos kairinājumu un negatīvas reakcijas.

  • testa konstruktīvā validitāte ir kritērijs, ko izmanto, novērtējot testu, kuram ir hierarhiska struktūra (izmanto sarežģītu psiholoģisko parādību izpētes procesā);
  • uz kritērijiem balstīta validitāte ietver testa rezultātu salīdzināšanu ar testa subjekta vienas vai otras psiholoģiskās īpašības attīstības līmeni;
  • satura validitāte nosaka metodoloģijas atbilstību pētāmajai parādībai, kā arī parametru diapazonu, ko tā aptver;
  • prognozēšanas derīgums ir tāds, kas ļauj novērtēt parametra turpmāko attīstību.

Derīguma kritēriju veidi

Testa derīgums ir viens no rādītājiem, kas ļauj novērtēt tehnikas atbilstību un piemērotību konkrētas parādības pētīšanai. Ir četri galvenie kritēriji, kas to var ietekmēt:

  • izpildītāja kritērijs (runājam par pētnieka kvalifikāciju un pieredzi);
  • subjektīvie kritēriji (subjekta attieksme pret konkrētu parādību, kas atspoguļojas gala testa rezultātos);
  • fizioloģiskie kritēriji (veselības stāvoklis, nogurums un citas īpašības, kas var būtiski ietekmēt gala testa rezultātu);
  • nejaušības kritērijs (notiek, nosakot konkrēta notikuma iestāšanās iespējamību).

Derīguma kritērijs ir neatkarīgs datu avots par konkrētu parādību (psiholoģisko īpašību), kuras izpēte tiek veikta ar testēšanas palīdzību. Kamēr nav pārbaudīta iegūto rezultātu atbilstība kritērijam, nevar spriest par derīgumu.

Pamatkritēriju prasības

Ārējiem kritērijiem, kas ietekmē testa derīguma indikatoru, jāatbilst šādām pamatprasībām:

  • atbilstība konkrētajai jomai, kurā tiek veikts pētījums, aktualitāte, kā arī semantiskā saistība ar diagnostikas modeli;
  • nekādu traucējumu vai asu pārtraukumu neesamība paraugā (jēga ir tāda, ka visiem eksperimenta dalībniekiem jāatbilst iepriekš noteiktiem parametriem un jāatrodas līdzīgos apstākļos);
  • pētāmajam parametram jābūt uzticamam, nemainīgam un nepakļaujam pēkšņām izmaiņām.

Derīguma noteikšanas veidi

Pārbaužu derīguma pārbaudi var veikt vairākos veidos.

Sejas derīguma novērtēšana ietver pārbaudi, vai tests ir piemērots mērķim.

Konstrukcijas derīgums tiek novērtēts, kad tiek veikta virkne eksperimentu, lai izpētītu konkrētu sarežģītu pasākumu. Tas iekļauj:

  • konverģentā validācija - dažādu sarežģītu paņēmienu rezultātā iegūto novērtējumu saistību pārbaude;
  • atšķirīgā validācija, kas ir nodrošināt, lai metodoloģija neparedz ārējo rādītāju novērtēšanu, kas nav saistīti ar galveno pētījumu.

Prognozējošā derīguma novērtēšana ietver iespēju prognozēt pētāmā indikatora svārstības nākotnē.

secinājumus

Testa derīgums un ticamība ir viens otru papildinoši rādītāji, kas sniedz vispilnīgāko pētījumu rezultātu godīguma un nozīmīguma novērtējumu. Bieži vien tie tiek noteikti vienlaikus.

Uzticamība parāda, cik ļoti var uzticēties testa rezultātiem. Tas nozīmē to noturību katru reizi, kad tiek atkārtots līdzīgs tests ar tiem pašiem dalībniekiem. Zema uzticamības pakāpe var liecināt par tīšu izkropļojumu vai bezatbildīgu pieeju.

Testa derīguma jēdziens ir saistīts ar eksperimenta kvalitatīvo pusi. Mēs runājam par to, vai izvēlētais instruments atbilst konkrētas psiholoģiskas parādības novērtējumam. Šeit var izmantot gan kvalitatīvos rādītājus (teorētiskais novērtējums), gan kvantitatīvos rādītājus (atbilstošo koeficientu aprēķins).