6-analiza univariata
TRANSCRIPT
Metode statistice utilizate în cercetarea de marketing
Capitolul V. ANALIZA UNIVARIATĂ A DATELOR ÎN CERCETĂRILE DE MARKETING
Analiza univariată a datelor în cercetările de marketing, vizează aplicarea tehnicilor statistico-matematice pentru studierea populaţiilor investigate, în funcţie de o singură variabilă, aceasta putând fi măsurată pe scală metrică sau nemetrică.
Procesul de analiză univariată se referă la calculul indicatorilor de frecvenţă (absolută şi relativă), a valorilor centralizate ale caracteristicii, precum şi la calculul indicatorilor tendinţei centrale, a indicatorilor variaţiei, asimetriei şi concentrării. De asemenea, se poate testa semnificaţia diferenţelor existente între diferitele subgrupe ale unei colectivităţi în funcţie de variaţia unei variabile de marketing.
În general, calculul frecvenţelor absolute şi relative şi, uneori, calculul valorilor centralizate ale caracteristicii se realizează în etapa de tabulare a datelor.
5.1. Determinarea indicatorilor tendinţei centrale Indicatorii tendinţei centrale sunt de două categorii: indicatori medii şi indicatori
de poziţie.
Indicatorii medii Media este un indicator sintetic care exprimă ceea ce este comun, tipic, esenţial şi
obiectiv şi elimină ceea ce este neesenţial, întâmplător în apariţia şi modul de manifestare a fenomenelor cercetate. Media este un indicator reprezentativ pentru colectivitatea cercetată numai dacă aceasta este omogenă din punctul de vedere al caracteristicii studiate.
Din categoria indicatorilor medii, în cercetările de marketing, se utilizează, îndeosebi, media aritmetică şi media geometrică.
Mărimile medii se calculează ca: medii simple, în cazul în care unităţile cercetate nu sunt grupate şi ca medii ponderate în cazul grupării pe variante sau intervale de variaţie a termenilor seriei. Când frecvenţele de apariţie ale fiecărei variante de variaţie (interval de variaţie) sunt egale, se pot calcula, de asemenea, medii simple.
Media aritmetică reprezintă acea valoare a caracteristicii care s-ar fi înregistrat la
nivelul tuturor unităţilor colectivităţii în situaţia în care toţi factorii de influenţă ar fi acţionat asupra unităţilor cu aceeaşi intensitate. Mediile aritmetice se calculează după următoarele formule:
media aritmetică simplă:
n
xx
n
ii
1 ;
media aritmetică ponderată:
93
Metode statistice utilizate în cercetarea de marketing
m
jj
m
jjj
n
nx
x
1
1 .
Un alt indicator mediu, deseori utilizat în analiza univariată a datelor în cercetările de marketing, este media geometrică. Aceasta se utilizează atunci când produsul între termenii seriei este posibil şi, de asemenea, în cazul în care termenii seriei înregistrează o concentrare către valorile mai mici sau când se doreşte a se acorda o importanţă sporită valorilor mai mici ale seriei. Mediile geometrice se calculează după formulele:
media geometrică simplă:
n
n
iig xx
1
;
media geometrică ponderată:
m
jj
jnnm
jjg xx 1
1
,
unde: în cazul formulelor de calcul ale mediilor simple:
- ix - valorile înregistrate ale caracteristicii;
- n – numărul de unităţi cercetate; în cazul formulelor de calcul ale mediilor ponderate:
- jx - variantele de variaţie (centrele intervalelor de variaţie în cazul grupărilor pe
intervale) înregistrate ale caracteristicii; - nj – frecvenţele de apariţie ale fiecărei variante de variaţie (fiecărui interval de
variaţie). Indicatorii de poziţie
Indicatorii de poziţie caracterizează forma în care sunt distribuite frecvenţele într-o serie de repartiţie. Aceşti indicatori sunt: modul sau dominanta seriei, cuantilele şi mediala.
Modul (dominanta) reprezintă acea valoare a caracteristicii care înregistrează cea
mai mare frecvenţă de apariţie. În seriile de repartiţie când datele sunt grupate, grupul modal reprezintă grupul
care înregistrează cel mai mare număr de unităţi. Când gruparea s-a realizat pe variante de variaţie, modul este reprezentat de
valoarea cu frecvenţa cea mai mare. În cazul grupărilor pe intervale de variaţie, determinarea valorii modale, după identificarea intervalului în care aceasta se încadrează (intervalul cu frecvenţa cea mai mare), presupune utilizarea formulei:
21
1
dxMoMoj
,
unde:
94
Metode statistice utilizate în cercetarea de marketing
Mojx – limita inferioară a intervalului modal;
d - mărimea intervalului modal; Δ1 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului precedent; Δ2 – diferenţa dintre frecvenţa intervalului modal şi frecvenţa intervalului următor.
În cazul seriilor grupate pe intervale neegale de variaţie, în calculul modului se vor utiliza frecvenţele reduse, determinate conform algoritmului descris în capitolul “Prezentarea grafică a datelor”, aceste frecvenţe fiind utilizate şi în reprezentarea grafică a datelor cu ajutorul histogramei sau a poligonului frecvenţelor.
Cuantilele sunt indicatori ai tendinţei centrale care împart seria într-un anumit număr de părţi (fiecare parte înregistrând acelaşi efectiv din numărul total de unităţi). Din categoria acestora amintim:
mediana (cuantila de ordinul 2) – divizează distribuţia în două părţi; cuartilele (cuantilele de ordinul 4) – divizează distribuţia în patru părţi; decilele (cuantilele de ordinul 10) – divizează distribuţia în zece părţi; centilele (cuantilele de ordinul 100) – divizează distribuţia în o sută părţi. Cuantilele de ordin superior se calculează pentru serii cu număr mare de grupe,
fiind utilizate mai rar în cercetările de marketing, comparativ cu mediana.
Calculul medianei în seriile de repartiţie simple (negrupate) presupune ordonarea crescătoare sau descrescătoare a valorilor. În cazul seriilor cu număr par de termeni, mediana va fi egală cu media aritmetică a valorilor centrale, respectiv, a valorilor cu numerele de ordine
2
n şi respectiv, 12
n .
În cazul în care numărul de termeni al serie este impar mediana este egală cu valoarea centrală a seriei, respectiv, cu termenul cu numărul de ordine
2
1n ,
unde n – numărul de termeni ai seriei.
În cazul seriilor grupate, pentru determinarea medianei (şi a celorlalte cuantile) se vor determina frecvenţele cumulate în sens crescător.
Dacă gruparea s-a realizat pe variante de variaţie, mediana este dată de termenul
căruia îi corespunde prima frecvenţă cumulată mai mare decât valoarea 21
m
jjn, iar dacă
gruparea este realizată pe intervale, atunci intervalul care corespunde primei frecvenţe
cumulate mai mare decât valoarea 21
m
jjn reprezintă intervalul median, iar pentru calculul
medianei se utilizează următoarea formulă:
Me
Me
Me
j
j
jj
m
jj
j n
n
n
dxMe
1
1
1
2
unde: nj – frecvenţa intervalului j;
95
Metode statistice utilizate în cercetarea de marketing
Mejx – limita inferioară a intervalului median;
d - mă
dentă intervalului median (frecvenţele cumulate până la
nivel
ă cu ter
corespunde prima frecvenţă cumulată mai mare decât valoarea
rimea intervalului median;
jn – frecvenţa cumulată prece1
1
Mej
j
ul intervalului median);
Mejn – frecvenţa intervalului median.
Similar se calculează şi cuantilele de ordin superior. Astfel, determinarea cuartilelor (în număr de trei) în cazul grupărilor pe variante de
variaţie se realizează după cum urmează: prima cuartilă este egal menul căruia îi
4
termenul căruia îi corespunde prima frecvenţă cumulată mai mare decât valoarea
1
m
jjn, a doua va fi egală cu
42 1j
j
(este egală cu mediana seriei), iar a trei-a, cu termenul căruia îi corespunde prima frecvenţă
cumulată mai mare decât valoarea
m
n
43 1j
j
. În cazul grupărilor pe intervale, după algoritmul
prezentat se determină doar interv
m
n
alele în care se încadrează cei trei indicatori, calculul lor fiind sim
mple) sau jumătate din
suma produselor termenilor ilor cu frecvenţe).
i
men ăruia îi corespunde primul nivel cumulat care este egal sau mai
mare de
ilar cu cel al medianei.
inarea decilelor şi a centilelor se va ţine cont de faptul că acestea împart În determseria în 10 şi, respectiv, 100 părţi egale, calculându-se, în consecinţă, 9 decile şi 99 centile.
Mediala este un indicator al tendinţei centrale care împarte (în condiţiile ordonării crescătoare a termenilor seriei), suma valorilor globale ale caracteristicii sau suma termenilor seriei în două părţi egale. Respectiv, este valoarea caracteristicii până la care se realizează jumătate din suma termenilor
n
iix
1
(în cazul seriilor si
j
jj nx1
În cazul seriilor simple, se determină valorile cumulate ale termenilor x , mediala fiind egală cu acel ter c
m (în cazul seri
cât valoarea 21i
i.
În cazul seriilor grupate pe variante de variaţie, se determină valorile cumulate ale produselor termenilor x
n
x
men c uia îi corespunde primul
nivel cu
jnj, mediala fiind egală cu acel ter ăr
mulat care este egal sau mai mare decât valoarea 2
1jjj
.
În cazul seriilor grupate pe intervale de variaţie, intervalul medial este cel căruia îi corespund ul nivel cumulat al produselor termenilor x
m
nx
e prim jnj egal sau mai mare decât
96
Metode statistice utilizate în cercetarea de marketing
21
m
jjj nx
valoarea . Formula de calcul a valorii medialei este asemănătoare cu cea a
medianei:
Mljj
j
jjj
m
jjj
jxMlMl nx
nx
nMl
1
1
1
unde:
– limita inferioară a intervalului medial;
ea intervalului medial;
– valorile globale ale caracteristicii cumulate până la nivelul intervalului
x
d2
Ml
d - mărimjx
1
1
Mlj
jjjnx
medial;
Mljjnx – valoarea globală corespunzătoare intervalului medial.
rmen sau faţă de media aritmetică (
5.2. Determinarea indicatorilor variaţiei Indicatorii variaţiei măsoară gradul de împrăştiere a termenilor unei serii. Există atât indicatori simpli ai variaţiei ce măsoară variaţia unui singur termen faţă de un alt
xte ), precum şi indicatori sintetici care exprimă într-o a variaţie a seriei. Dintre indicatorii simpli se utilizează, cu
precăde
ţiei Amplitudinea variaţiei se p în mărime absolută, fie în mărime
relativă
A = xmax – xmin
Amplitudinea relativă a variaţiei se exprimă, de regulă, în procente şi se calculează rin raportarea amplitudinii absolute a variaţiei la media aritmetică a termenilor:
singură expresie întreagre, amplitudinea variaţiei, iar din categoria indicatorilor sintetici, abaterea medie
pătratică, dispersia şi coeficientul de variaţie. Amplitudinea varia
oate ca cula fiel. Amplitudinea absolută a variaţiei se calculează ca diferenţă între nivelul maxim şi,
respectiv, nivelul minim al variabilei cercetate:
p
100% x
AA
Abaterea medie pătratică (abaterea standard)
Abaterea medie pătratică se calculează ca medie pătratică a abaterilor termenilor faţă de media lor aritmetică. Acest indicator exprimă, în mod sintetic, cu cât se abat (în
alta a mediei aritmetice. De fapt, scăzând şi adunând la valoarea edie, valoarea calculată a abaterii medii pătratice, se obţine intervalul mediu de variaţie al termenilor seriei. Abaterea medie pătratică se calculează pe baza următoarelor formule:
medie) termenii seriei de o parte şi de m
97
Metode statistice utilizate în cercetarea de marketing
în cazul seriilor simple:
n
xxn
ii
2
1
;
în cazul seriilor de frecvenţe:
j
m
j
m
jjj
n
nxx
1
1
2
.
bilele de marketing” al ulează cu ajutorul formulelor:
în cazul seriilor simple:
Dispersia (varianţa)
Dispersia se calculează ca o medie aritmetică a pătratelor abaterilor termenilor faţă de media lor. Acest indicator este utilizat, îndeosebi, în analiza dispersională (metodă prezentat di tudierea legǎturilor dintre variaă stinct în capitolul “Sprezentei lucrări). Dispersia se calc
n
xxn
ii
2
12
;
în cazul seriilor de frecvenţe:
m
jj
m
jjj
n
nxx
1
1
2
2.
Coeficientul de variaţie
Coeficientul de variaţie este un indicator ce măsoară gradul de omogenitate al seriei sau reprezentativitatea mediei. Acest indicator se poate calcula ca raport între abaterea medie pătratică şi media aritmetică a termenilor. Intervalul în care acest indicator ia valori este (0, 100%), o valoare mai mică atestând un grad mai mare de omogenitate. Se consideră că dacă acest coeficient este mai mic de 35 – 40% seria este omogenă, iar media este reprezentativă pentru seria dată. Când coeficientul de variaţie depăşeşte această limită se impune o divizare a colectivităţii pe grupe omogene şi calculul mediilor parţiale.
100x
V
De fapt, coeficientul de
variaţie se poate folosi ca un test de semnificaţie pentru edia aritmetică a termenilor. m
98
Metode statistice utilizate în cercetarea de marketing
5.3. Studierea asimetriei
r) iar pentru măsurarea asimetriei poate fi folosit unul dintre coeficienţii lui
Asimetria se referă la modul în care frecvenţele unei distribuţii se abat de la curba normală a frecvenţelor. Într-o serie simetrică media aritmetică, mediana şi modul sunt egale, iar frecvenţele se distribuie simetric, de o parte şi de alta a acestor valori. O serie asimetrică se poate uşor identifica cu ajutorul graficului (histograma sau poligonul frecvenţeloPearson:
Mox
CAs
,
unde:
x - media aritmetică a termenilor; Mo – modul sau dominanta seriei;
. Dacă se apropie de 0, asimetria ste mai redusă. Dacă CAs = 0, seria este perfect simetrică.
.4. Determinarea gradului de concentrate
Coefici
ţie concentrarea poate fi măsurată cu ajutorul coeficientului abaterii medială – mediană:
σ – abaterea medie pătratică.
Acest coeficient ia valori între (-1, 1), o valoare mai apropiată de limitele intervalului de variaţie atestând o asimetrie mai pronunţatăe 5
entului abaterii medială – mediană Concentrarea semnifică faptul că o pondere mică din totalul unităţilor cercetate
cuprinde o pondere mare din valoarea globală a caracteristicii. Într-o serie de distribu
100
A
MeMlM ,
unde: Ml - mediala; Me – mediana; A – amplitudinea absolută a variaţiei.
Acest coeficient ia valori în intervalul (0, 100%), o valoare mai apropiată de 0 atestând o concentrare mai slabă, iar o valoare mai apropiată de 100%, o concentrare mai puternică a valorii globale a caracteristicii la nivelul unităţilor cercetate. Dacă coeficientul ia valoarea 100% suntem în situaţia de monopol, iar dacă este 0, în situaţia de chirepartiţie.
Coefici
se utilizează coeficientul lui Struck (coeficientul de concentrare Gini corectat):
e
entul lui Struck (coeficientul de concentrare Gini corectat) În cercetările de marketing, adesea, pentru studierea concentrării valorii globale a
caracteristicii la nivelul unităţilor cercetate
99
Metode statistice utilizate în cercetarea de marketing
1
11
nC i ,
2 gnn
i
are apropiată de 0 atestă o distribuţie relativ uniformă a activităţii de
ambilor coeficienţi prezentaţi anterior (datorită faptului că limitele intervalelor de variaţie nu depind de numărul de unităţi cercetate), se pot realiza
neparametriSe lansează ipoteza nulă conform căreia diferenţele dintre grupe, din punctul de
vedere al caracteristicii studiate, nu sunt semnificative. estului presupune determinarea valorii calculate 2 cu ajutorul formulei:
unde: n – numărul unităţilor cercetate; gi – ponderea valorii caracteristicii realizate de unitatea i în valoarea totală a caracteristicii realizată de cele n unităţi cercetate.
Acest coeficient este utilizat frecvent pentru măsurarea repartiţiei în spaţiu a activităţii de piaţă. În acest caz, n va fi constituit din unităţi administrativ – teritoriale, întreprinderi, puncte de vânzare, etc, iar gi va reprezenta ponderea vânzărilor realizate de unitatea i în totalul realizărilor celor n unităţi.
Coeficientul C aparţine intervalului [0, 1]. Luând exemplul studierii gradului de concentrare a activităţii de piaţă, o valoare apropiată de 1 semnifică o concentrare puternică, iar o valopiaţă la nivelul celor n unităţi. Când valoarea coeficientului de concentrare este 1, suntem în situţia de monopol (întreaga activitate de piaţă este desfăşurată de o singură unitate), iar valoarea 0 atestă o echirepartiţie (toate cele n unităţi au contribuţii identice la desfăşurarea activităţii de piaţă).
Cu ajutorul
comparaţii, din punctul de vedere al gradului de concentrare, între mai multe colectivităţi supuse investigaţiei.
5.5. Testarea semnificaţiei statistice a diferenţelor dintre grupe - testul neparametric 2 pentru o singură variabilă
În cazul seriilor grupate după variaţia unei caracteristici calitative se poate testa
semnificaţia statistică a diferenţelor dintre grupe (în contextul în care eşantionul studiat este reprezentativ pentru colectivitatea cercetată). Pentru aceasta se utilizează testul
c 2 pentru o singură variabilă.
Aplicarea t
, ii
1i iA
2
= numărul de variante ale variabilei studiate; Oi = frecvenţele reale aferente variantei i a variabilei cercetate; Ai = frecvenţele teoretice aferente variantei i, cores nzătoare ipotezei
e conform căreia diferenţele dintre grupe nu sunt semnificative.
2 n AO
unde: n
punul
n
OA
n
ii
i
1 .
100
Metode statistice utilizate în cercetarea de marketing
V retică citită din tabelele repartiţiei 2, pent
acă: 2 calculat > 2 teoretic, ipoteza nulă se respinge, diferenţele dintre grupe, din pun
tode statistice de analiză univariată a datelor, în capitolu
lor măsurate pe scală nominală presupune determinarea: distribuţiei de frecvenţe (absolute şi relative), a grupului modal, a gradului de concentrare a unităţilor la nivelul diferitelor grupe (utilizând coeficientul lui Struck), precum şi testarea semnificaţiei statistice a diferenţelor dintre grupe cu ajutorul testului neparametric 2 pentru o singură variabilă.
aloarea calculată 2 se compară cu valoarea teoru n-1 grade de libertate şi un anumit nivel de semnificaţie determinat în funcţie
de probabilitatea P cu care se garantează rezultatele: = 1 - P, dacă şi P se exprimă în coeficienţi şi, respectiv, = 100 - P, dacă şi P se exprimă în procente.
Dctul de vedere al caracteristicii studiate, sunt semnificative; 2 calculat < 2 teoretic, ipoteza nulă se acceptă, diferenţele dintre grupe,
din punctul de vedere al caracteristicii studiate, nu sunt semnificative. Există o multitudine de mel de faţă fiind prezentate unele dintre acelea utilizate cu o mai mare frecvenţă în
procesul cercetărilor de marketing. Alegerea metodelor de analiză univariată prezentate trebuie să ţină cont de tipul de scală pe care sunt măsurate variabilele cercetate şi, bineânţeles, de obiectivele cercetării.
Astfel, dintre metodele prezentate, în cazul variabilelor măsurate pe scală metrică pentru analiza datelor se utilizează, îndeosebi: distribuţia de frecvenţe (absolute şi relative), media aritmetică, modul, cuantilele, mediala, indicatorii variaţiei şi asimetriei, coeficientul abaterii medială – mediană. În cazul variabilelor măsurate pe scală proporţională se calculează şi media geometrică. În analiza variabilelor măsurate pe scală ordinală se utilizează: distribuţia de frecvenţe (absolute şi relative), grupul modal şi cuantilele. De asemenea, analiza univariată a variabile
101
Metode statistice utilizate în cercetarea de marketing
STUDII DE CAZ Analiza univariată a unei serii de distribuţie simple
Piaţa unui produs “A” circumscrisă unui anumit teritoriu este disputată de 8 firme concurente. Vânzările realizate de fiecare dintre acestea, în decursul unui an, se prezintă în următorul tabel:
Nr. crt. întreprindere I II III IV V VI VII VIII Vânzări (mil. u.m.) 13 32 21 89 87 52 40 32
Pe baza acestor date se doreşte realizarea analizei vânzărilor înregistrate de cele 8 unităţi comerciale:
Ponderile deţinute de fiecare unitate în totalul vânzărilor realizate, indicatori ce atestă, de fapt, cotele de piaţă ale fiecărei întreprinderi, se prezintă astfel:
Nr. crt. întreprindere I II III IV V VI VII VIII Total Vânzări (mil. u.m.) 3,6 8,7 5,7 24,3 23,8 14,2 10,9 8,7 100.0
Se observă că lider pe respectiva piaţă este unitatea IV, urmată de V, fiecare dintre ele deţinând aproximativ un sfert din piaţa de referinţă. Indicatorii tendinţei centrale:
media aritmetică:
75,458
32 40 52 87 89 21 32 131
n
xx
n
ii
mil. u.m.;
modul sau dominanta:
Mo = 32 mil. u.m.;
mediana:
Pentru calculul medianei ordonăm crescător termenii:
Rangul (numărul de ordine) 1 2 3 4 5 6 7 8 Vânzări (mil. u.m.) 13 21 32 32 40 52 87 89
Fiind un număr par de termeni, mediana va fi egală cu media aritmetică a valorilor
centrale (respectiv, a valorilor cu numerele de ordine 42
8 şi respectiv, 51
2
8 )
Me = 362
40 32
mil. u.m.
În medie, cele 8 societăţi comerciale au realizat vânzări în valoare de 45,75 mil. u.m. Valoarea cea mai frecvent întâlnită în distribuţie este 32 mil. u.m. Jumătate dintre întreprinderi au realizat vânzări de până la 36 mil. u.m. şi jumătate peste această valoare.
102
Metode statistice utilizate în cercetarea de marketing
Indicatorii variaţiei:
amplitudinea variaţiei:
A = xmax – xmin = 89-13=76 mil. u.m.;
amplitudinea relativă a variaţiei:
%12,16610075,45
76100%
x
AA ;
abaterea medie pătratică (abaterea standard):
71,26
8
)75,4532(....)75,4521()75,4532()75,4513( 2222
2
1
n
xxn
ii
mil. u.m.;
dispersia (varianţa):
44,713
8
)75,4532(....)75,4521()75,4532()75,4513( 2222
2
12
n
xxn
ii
;
coeficientul de variaţie :
%38,5810075,45
71,26100
xV
.
În ceea ce priveşte gradul de variaţie, se observă că vânzările realizate de cele 8 societăţi înregistrează o amplitudine absolută de 76 mil. u.m., ceea ce, raportat la media termenilor, reprezintă 166,12%.
În medie vânzările se abat de la media lor aritmetică cu +/- 26,71 mil. u.m. Ceea ce se observă este faptul că media vânzărilor nu este reprezentativă pentru cele 8 societăţi, datorită lipsei omogenităţii valorilor înregistrate (V > 35 – 40%). Studierea asimetriei:
Coeficientul lui Pearson:
515,071,26
3275,45
o
As
MxC
Coeficientul lui Pearson atestă un grad mediu de asimetrie a seriei. Determinarea gradului de concentrare:
Nr. crt. întreprindere
I II III IV V VI VII VIII Total
Vânzări (mil. u.m.) 13 32 21 89 87 52 40 32 366
n
ii
ii
x
xg
1
0,036 0,087 0,057 0,243 0,238 0,142 0,109 0,087 1,000
gi2 0,001 0,008 0,003 0,059 0,057 0,020 0,012 0,008 0,168
103
Metode statistice utilizate în cercetarea de marketing
Coeficientul lui Struck:
221,018
1168,08
1
11
2
n
gnC
n
ii
Gradul de concentrare a desfacerilor la nivelul celor 8 întreprinderi este relativ mic.
Analiza univariată a unei serii de distribuţie de frecvenţe cu intervale Distribuţia unui eşantion de 600 persoane, consumatori ai unui produs “A”, după
cheltuielile realizate cu această destinaţie, în decursul unui an, se prezintă în următorul tabel:
Grupe de persoane după cheltuielile realizate, în decursul unui an, pentru
achiziţionarea produsului “A” (mil. u.m.)
Număr persoane (frecvenţe absolute)
ni
0-30 120 30-60 180 60-90 140
90-120 100 120-150 60
Total 600
Pe baza acestor date se doreşte realizarea analizei cheltuielilor efectuate de către cei 600 consumatori, în decursul unui an, pentru achiziţionarea produsului “A”.
Notă: Calculele necesare determinării valorilor diferiţilor indicatori sunt prezentate în tabelul de la sfârşitul aplicaţiei.
Indicatorii tendinţei centrale:
media aritmetică:
65600
000.39
1
1
m
jj
m
jjj
n
nx
x mil. u.m.;
modul:
48)140180()120180(
)120180(3030
21
1
dxMoMoj
mil. u.m.;
mediana:
60140
3003003060
2
1
1
1
Me
Me
Me
j
j
jj
m
jj
j n
n
n
dxMe mil. u.m.;
104
Metode statistice utilizate în cercetarea de marketing
mediala:
43,87500.10
900.9500.193060
2
1
1
1
Mljj
j
jjj
m
jjj
j nx
nx
nx
dxMl
Ml
Ml
mil. u.m.
Indicatorii tendinţei centrale atestă că, în medie, fiecare din cei 600 consumatori au realizat cheltuieli pentru achiziţionarea produsului “A” în valoare de 65 mil. u.m.
Nivelul cheltuielilor cel mai frecvent întâlnit la nivelul eşantionului cercetat este de 48 mil. u.m.
Din cele 600 persoane, 50% realizează cheltuieli de până la 60 mil. u.m., iar restul de 50% peste această valoare.
Jumătate din totalul cheltuielilor realizate de cei 600 consumatori pentru
achiziţionarea respectivului produs ( = 39.000 mil.u.m.) este realizată de către
persoanele care au înregistrat cheltuieli cu această destinaţie de până la 87,43 mil. u.m., iar restul de 50% de către cei care au realizat cheltuieli mai mari de 87,43 mil. u.m.
m
jjj nx
1
Indicatorii variaţiei:
amplitudinea variaţiei:
A= xmax – xmin = 150 – 0 =150 mil. u.m.;
amplitudinea relativă a variaţiei:
%77,23010065
150100%
x
AA ;
abaterea medie pătratică (abaterea standard):
42,37
600
000.840
1
1
2
m
jj
m
jjj
n
nxx
mil. u.m.;
dispersia (varianţa):
1400
600
000.840
1
1
2
2
m
jj
m
jjj
n
nxx
;
coeficientul de variaţie :
%57,5710065
42,37100
xV
.
În ceea ce priveşte gradul de variaţie, se observă că variabila “cheltuieli pentru achiziţionarea produsului A” înregistrează, la nivelul eşantionului constituit din cei 600
105
Metode statistice utilizate în cercetarea de marketing
consumatori, o amplitudine absolută de 150 mil. u.m., ceea ce, raportat la media termenilor, reprezintă 230,77%.
În medie cheltuielile pentru achiziţionarea produsului “A” se abat de la media lor aritmetică cu +/- 37,42 mil. u.m. Ceea ce se observă este faptul că media cheltuielilor nu este reprezentativă pentru colectivitatea cercetată, datorită lipsei omogenităţii valorilor înregistrate. Se impune, astfel, divizarea colectivităţii pe grupe omogene şi calculul mediilor parţiale.
Studierea asimetriei:
Coeficientul lui Pearson:
454,042,37
4865
o
As
MxC
Se observă un grad mediu de asimetrie a distribuţiei celor 600 consumatori în funcţie de cheltuielile realizate pentru achiziţionarea produsului “A”. Determinarea gradului de concentrare:
Coeficientul abaterii medială - mediană:
%29,18100150
6043,87100
A
MeMlM
Concentrarea cheltuielilor realizate pentru achiziţionarea produsului “A”, pe grupe de consumatori după nivelul cheltuielilor realizate, este relativ redusă.
Centrele intervalelor
( ) jx
Frecvenţe absolute
jn
Frecvenţe relative
Valorile globale
jjnx
Frecvenţe absolute cumulate crescător
Valorile globale
cumulate crescător
2 jj nxx
15 120 20,0 1800 120 1800 300000 45 180 30,0 8100 300 9900 72000 75 140 23,3 10500 440 20400 14000 105 100 16,7 10500 540 30900 160000 135 60 10,0 8100 600 39000 294000
Total 600 100,0 39000 - - 840000
106
Metode statistice utilizate în cercetarea de marketing
Testarea semnificaţiei statistice a diferenţelor dintre grupe - testul 2 pentru o singură variabilă
O societate comercială a organizat o cercetare asupra unui eşantion reprezentativ
de 1.200 persoane cu scopul de a determina care sunt aprecierile cumpărătorilor faţă de un nou produs lansat pe piaţă şi dacă aceste diferenţe sunt semnificative.
Rezultatele centralizate ale cercetării se prezintă în primele două coloane ale tabelului de mai jos:
Aprecieri faţă de noul produs
Numărul respondenţilor
Oi Ai (Oi-Ai) (Oi-Ai)
2 i
ii
A
AO 2
Foarte favorabile 324 240 84 7056 29,4 Favorabile 356 240 116 13456 56,1 Neutre 214 240 -26 676 2,8 Nefavorabile 185 240 -55 3025 12,6 Foarte nefavorabile 121 240 -119 14161 59,0
Total 1200 1200 - - 159,9
Lansăm ipoteza nulă, conform căreia nu există diferenţe semnificative între aprecieri. Se calculează frecvenţele Ai rezultate conform acestei ipoteze.
2405
12001
n
O
A
n
ii
i
n
i i
ii
A
AO
1
22 159,9
Notă: Toate calculele necesare determinării valorii 2 sunt prezentate în tabel.
Valoarea tabelată 2 pentru 4 grade de libertate şi un nivel de semnificaţie de 0,005 este 14,86 < 159,9. Rezultă că se poate garanta cu o probabilitate de 99,5% că diferenţele între aprecierile faţă de noul produs sunt semnificative.
107