3. Биометрия - средно квадратично отклонение. Приложение.


.

Биометрично определение: Средното квадратно отклонение S (степен на вариране на признака) посочва средно с колко се отклонява всяко х от средната (степен на вариране на данните около средната аритметична "хикс черта"). Т.е. средната степен на отклонението на всички представители на извадката. Онагледява основното св-во на вариационният ред - степен на вариабилитет, и колкото по-голяма е стойността на S, толкова по-силно е варирането и толкова е по-голямо разсейването около средната аритметична.
Освен вариабилитет във вариационният ред, средното квадратно отклонение се ползва за определяне на отклонението на средната аритметична на пробата от средната аритметична на генералната съвкупност.

Формули за изчисляване на средно квадратично отклонение:
1. Освен приложената по-горе в упражненията формула, описваща (непряко) получаване на средно квадратично отклонение S чрез условна средна А, съществуват и други работни формули.
2. Ср. кв. отклонение S може да се изчисли и чрез извличане на корен квадратен от дисперсията S2 = Σ(x-х)2 / n и да се достигне до мерните единици на средната аритметична (дисперсията няма мерни единици).
Т.е. чрез коренуване сумата на квадратите на отклоненията от средната аритметична, разделена на обема на извадката Σ(x-х)2 / n, което е по Гаус за големи проби; по Басел с вариант на същата формула, но за малки проби n<30 в знаменател е (n-1)
Забележка: да не се бърка с разгънатата формула за грешката на средната аритметична Sх
ср.кв.отклонение пряко изчисление3. Третата формула посочва изчисляване по пряк начин, без да е изчислена средната аритметична за реда. Примерно десет растения, в едната колонка числата на признак по брой, сумирани накрая в Σх, втората колонка е всяко число на квадрат и накрая квадратите сумирани Σх2. Примерът е с малки числа. При вариантът с големи числа, които се редуцират чрез изваждане число К от всеки х, а накрая към полученият резултат се прибавя К.
 
Свойства на средното квадратично отклонение:
1. Ако всеки елемент във вариационният ред бъде увеличен или намален с едно и също число, стойността на средното квадратно отклонение няма да се измени, ако в края на изчисленията се коригира със същото число. Може да се приложи при намаляване на големи числа за услеснение на изчисленията, а в края резултатът се коригира чрез прибавяне на изважданото от всеки елемент число.
2. Ако всеки елемент във вариационният ред бъде разделен с едно и също число K, стойността на ср.кв.отклонение се намалява K пъти. Накрая стойността се умножава с К за да се получи реалното ср.кв.отклонение. Също се ползва за намаляване на големи числа и улесняване на изчисленията.

Правилото на трите сигми се трансформира в правилото на трите S, когато "хикс черта" е неизвестна и не е резултат от обработки на разпределението (тогава е в границите на 6 пъти S). Крайните стойности (в ляво и в дясно) на доверителният интервал при P=99% (т.е. във вероятността W=99,75%) се получават като съответно "хикс черта" се събере и извади от 3S. В статистиката за доверителен интервал се счита P=95%.

Вариационният коефициент S% (средно квадратно отклонение в процент) е процентното отклонение спрямо средната аритметична. Колкото по-голяма е стойността му, толкова по-пластичен е признакът (по-вариабелен). Стойността винаги е по-голяма от нула и до 10% се смята за слабо вариране (над 20% е силно вариране).
Освен за съпоставяне изменчивостта на разноименни признаци се ползва и при разузнавателният опит за определяне степен на почвено вариране. Освен това S% е компонент във формула за определяне обема на пробата или броят повторения за получаване на желаната точност.

______________________

Допълнителни материали. Средното квадратично отклонение не е само хоризонтална величина:

среда средно квадратно отклонение 1. Средата на средното квадратно отклонение S може да се ползва за начертаване хоризонталните допуски на вероятното местоположение на генералната средна аритметична спрямо средната аритметична на пробата.

 Както вече посочихме, освен вариабилитетът във вариационният ред, чрез S се установява и средата на интервалът на лявата и дясната граница спрямо х, в който се намира ср.аритм. на генералната съвкупност Хо. Биометрията ползва S за определяне на отклонението на средната аритметична на пробата от средната аритметична на генералната съвкупност. Т.е. S посочва с колко се отклонява х на пробата, от "хикс нула" на генералната съвкупност, която я съдържа. Казано по друг начин: на какво разстояние от х, се намират границите на зоната в която вероятно е средната аритметична на генералната съвкупност.
   Използваната формула съдържа в числителят сумата от стойностите на f (честота на повторение) и отклоненията d от A (d е с по-голяма тежест понеже е повдигнат на квадрат). Плюс и минус пред формулата означават, че средата на стойността на S посочва границите на хоризонталното отклонение в ляво и дясно от х. Интервалът върху милиметровата хартия освен спрямо х се отбелязва и спрямо средната аритметична A (понеже тя основно съставлява "хикс черта"). Така границите се маркират с широки линии (самата линия се състои и от х и от А).

лява и дясна граница спрямо среда S

вероятна локализация на генералната средна аритметична

квадратче за практически цели 2. За практически цели и първоначална ориентация е достатъчно механично завъртане с пренасяне на допуските на S до образуване на квадратно прозорче, което заедно с трите зони на доверителните интервали ни насочва за вероятното местоположение на генералната средна аритметична Хо.

 Височината на вариационният ред при най-често срещаната величина се нарича ексцес (fmax = A). Понеже в S освен хоризонтален компонент d2 се съдържа и вертикален компонент f - можем да нанесем и вертикалното отклонение (вертикално вариране на ексцес). Така се обособява вероятната зона в която се намира ср. аритмет. на генералната съвкупност.
 При графично решение за улеснена ориентация приемаме, че вертикалното отклонение е колкото хоризонталното и се получава квадратно "прозорче". При числовите изражения обаче, вариабилитетът на ексцеса на пробата се изчислява, защото прецизирането на изчисленията ни дава по-пълна информация за местоположението на Хо. Ще установим, че вече нанесеното за практически цели вертикално отстояние, е почти същото както изчисленото впоследствие вертикално отклонение (ексцес).

процентен дял на вертикален f 3. За по-голяма прецизност границите на вертикално отклонение (ексцес) на генералната средна аритметична се изчисляват. Част от средното квадратно отклонение S указва и вертикалните допуски спрямо средната аритметична на пробата, в които е вероятното местоположение на генералната средна аритметична.

 Изчислява се чрез процентното дялово участие на всяко f, което участва във всеки вертикален ред спрямо f.d2. Т.е. установява се тежестта на f в S. За целта се изважда стойността на Af от Σf и се разделя на Σf.d2. Получената стойност се умножава по сто за да се установи процентният дял на участващите f в крайните резултати на Σf.d2. Чрез така полученият f% се намира коригираното S. Коригираното S се дели на две и се нанася под и над А. Върху тези две вертикални граници се отбелязват точките на изчислените три доверителни интервала P, като те също се нанасят. Смятало се е че е замервано прецизно, когато А е попадала върху границата на някой от доверителните интервали.

вертикален допуск чрез ср.кв.отклонение

S, f% и трите доверителни интервала 4. По-пълна информация за вероятното местоположение на генералната средна аритметична, се получава като към начертаните хоризонтални и вертикални отклонения S и коригирано S чрез f%, се добавят и трите зони на доверителните интервали P.

 Смятало се е че е замервано прецизно, когато А е попадала върху границата на някой от доверителните интервали, но това е валидно само за графиките на прекъснатите интервали (брой), където е истинската ефективност на методът t-Student.
Графиките за непрекъснато вариращ интервал (каквато е настоящата - сантиметри) са изградени чрез изкуствено създадени класове с приблизителна еднаквост и попадането на А върху граница на доверителен интервал не е указващо за прецизността на работа.
В така образуваното "прозорче" очертаваме вероятната зона в която е Хо ползвайки логиката на свободното пространство. (отляво имаме наслагване на гранични зони, а отдясно доверителните интервали предотвратяват навлизане в зоната на ср.квадр. отклонение).


Детайли по очертаване на вероятната зона около х където е генералната средна аритметична Хо:


средно квадратно отклонение
Накратко: 1. Стойността S трябва да е четна преди да се раздели на две: 0,89-0,01=0,88/2=0,44 см.; Приехме, че средата на интервала е х и изчислихме отстоянието на 0,44 см. в ляво и дясно, където очертава зоната в която се намира Хо. Хоризонталните граници са 13,84+0,44=14,28 см., 13,84-0,44=13,4 см. Същите хоризонтални отстояния се изчисляват и спрямо A±0,44 см. Левите и десните граници се нанасят върху графиката на милиметровата хартия като две удебелени граници.
2. Прескачаме вариантът с изграждане на "квадратно прозорче за практически цели" и преминаваме директно към изчисляване на вертикалният вариабилитет.
3. Вертикалният вариабилитет (отклонението от А) се изчислява според тежестта на процентният дял на f в конкретното S по формулите за
f% и коригирано S. За да може двете линии да се нанесат върху графиката, стойността също се разделя на две, но може да е и нечетна (поради дисперсията е възможно редуване четно, нечетно).
4. Впоследствие върху двете линии на вертикалният вариабилитет се нанасят изчислените триъгълни отметки през които преминават хоризонталните доверителни интервали при P(5%), P(1%) и P(0,1%).
В така ограниченото свободно пространство, очертаваме вероятната зона, в чиято среда по хоризонтал се намира генералната средна аритметична. Графичното решение на задачата ни посочва, че Хо = 13,91 см. Спрямо тази стойност сравняваме средната аритметична на пробата ни 13,84 см., като изводът е, че поради малката разлика (0,7 милиметра) спрямо генералната средна аритметична, посевът ни е оптимален по признакът "дължина на клас". Освен това според 50% от вертикалният вариабилитет, възможното отклонение от А по признакът "дължина клас" е A±1,05 милиметрa (0,21см/2).

Важно:Трябва да се има предвид, че се изчисляват само границите на "вероятната зона". Т.е. ляво, дясно, както и във вертикал. Лявата граница: малкото отстояние от А на половината ср.квадр. отклонение. Дясната граница: средата между интервалите P(1%) и P(0,1%). След това се изчислява средата на "вероятната зона" между лявата и дясната граница, където е Хо.
При графично решение обаче, върху милиметровата хартия се нанасят всички стойности, т.е. интервалите S освен спрямо х се отбелязват и спрямо средната аритметична A. По този начин границите се маркират с широки линии (самата линия се състои и от х и от А). Трите доверителни интервали според t-Student се изчисляват и отбелязват само спрямо х както е според формулите с t таблично от таблицата t-Student (методът залага на усреднена стойност).

средно квадратно отклонениеБрой класчета: Стъпките на изграждане на графиката са същите, като по-горе. При изграждане на графиката, освен до достигане на графично решена задача, се постига и прегледност от която е по-ясно за какво точно се изчисляват средно квадратично отклонение и трите доверителни интервали. Въпреки че методът t-Student е по-скоро графичен, чрез него може да се изчислява и директно за по-точни резултати. Примерно, когато всички посочени стойности трябва да се нанасят върху милиметрова хартия на площ от няколко квадратни милиметра са нужни лупа, остър молив и добра осветеност. След като вече се знае как точно е изградена графиката можем да изчисляваме директно.
Вероятната зона граничи както следва:
а. отляво със стойността 20,2856 равна на -1/2 средно квадратично отклонение, отстоянието му от А; Стойността на ср.кв.откл. се взима преди закръглянето, цялата дроб до 4-ти знак след десетичната запетая.
Нататък изчисленията са с цялата дроб без закръгляния. Двата десни доверителни интервали P, които ползваме се изчисляват с цялата дроб на Sх.
b. отдясно със средата 21,328217 между десните граници P(1%)=21,250977 и P(0,1%)=21,405458. Получава се от разликата им разделена на две и прибавена към P(1%) 21,250977+0,0772405;
Изчислената генерална средна аритметична е по средата между тези две граници на "вероятната зона". Т.е. изваждаме 21,328217 - 20,2856 = 1,042617 /2 = 0,5213085 + 20,2856 = 20,806908 бр.
Ср. аритметична на пробата е 20,7200 бр. и отстои от генералната средна на 0,086908 см. = 0,8691 милиметра. Този резултат може да бъде сравнен спрямо отстояния през минали години. Колкото по-близо е х до Хо толкова по-оптимално развит е изследваният признак.
Вертикалният вариабилитет на А се изчислява като коригираният S разделим на две, което ни посочва двете вече нанесени линии, а 50% от стойността е толерансът в който сортът може да променя броят класчета: 0,47 / 2 = 0,235 / 2 = 0,1175 = А±1,175 мм. вертикално отклонение (тук понякога следват редуване: четно, нечетно, четно, защото граничат с дисперсията). Въпросното отклонение ни посочва генетичната пластичност на този сорт. Т.е. това е потенциалът, който може да бъде разкрит чрез по-добри условия на отглеждане, които могат да увеличат средната стойност на признакът "брой класчета" с процентна стойност съответстваща на графичното изменение от 1,175 мм. Изразяваме честотата на случване на "брой класчета" чрез милиметри, т.е. за ±А възможният максимум през следващата година при по-добри условия. Максимумът от 21 "бр.класчета" за посевът ще е увеличил средната стойност на честотата на случването си от f 15 на f 15,1175 (генетичен потенциал при идеални условия).
Поради тази генетична възможност сортовете повишават добивите си през годините, но за проявата е нужна все по-добра агротехника.
Понеже се касае за признак с прекъснато вариране (цели числа - брой), тези изчисления може да се смятат за меродавни, т.е. приложеният метод е предназначен за такова вариране.

Изводи и насоки: Контурите на вероятната зона обграждат конкретното напречно сечение на триизмерната графика на дисперсията. В средата на така очерталата се зона се намира генералната средна аритметична, която се явява център на разсейването (дисперсията).
Средната аритметична на пробата е в ляво от Хо т.е. изследваният признак (брой класчета) в посевът ни е под универсалната средна стойност за посевите от изследваният сорт. Конкретното отстояние от генералната средна е уникално за този сорт през съответната година. Това е сравнителна величина, която може да бъде съпоставена с еквивалентен опит от минали години. Колкото отстоянието на "хикс черта" от "хикс нула" е по-малко, толкова повече специфичната комбинация от климатично-почвени характеристики през годината са благоприятствали за получаване на признак, чиято стойност се доближава до еталонната за този сорт във всички подобни райони.
Познанията по дисперсия спомагат за получаване и на допълнителни изводи относно алтернативни местонахождения на средни аритметични. Някои проби от някои сортове не дават верен резултат и данните им подлежат на обработка по различен метод.
Леснотата и прегледността на графичните решения обясняват изключителната популярност на t-Student в миналото. За съжаление графичните решения се смятат за недостатъчно точни и бързи, което ограничава приложението му. За последващо подобряване на точността може да се приложи методът на Дънкан.


Събиране база данни Вариационен обем, редове Норамална крива Средно квадратично отклонение Грешка на средната аритметична Критерий на Student Безстандартни методи Стандартни методи Биометрия на рапица, практика

Упражненията по биометрия като pdf файл

Home | Плевели | Биометрия | Маркетинг | Вредители | Лимец и спелта | Произходни центрове | Карта на сайта | Съобщи за неточност