Logo am.boatexistence.com

የጎደሉ እሴቶችን በአማካኝ የመቁጠር ጉድለቶች ምንድን ናቸው?

ዝርዝር ሁኔታ:

የጎደሉ እሴቶችን በአማካኝ የመቁጠር ጉድለቶች ምንድን ናቸው?
የጎደሉ እሴቶችን በአማካኝ የመቁጠር ጉድለቶች ምንድን ናቸው?

ቪዲዮ: የጎደሉ እሴቶችን በአማካኝ የመቁጠር ጉድለቶች ምንድን ናቸው?

ቪዲዮ: የጎደሉ እሴቶችን በአማካኝ የመቁጠር ጉድለቶች ምንድን ናቸው?
ቪዲዮ: Data Science with Python! Joining Tables Without a Common Column 2024, ግንቦት
Anonim

አማካኝ ግምት በተለዋዋጮች መካከል ያለውን ግንኙነት ያዛባል ነገር ግን አማላጅነት ብዙ ግንኙነቶችን ያዛባል እና እንደ ትስስር ያሉ ስታቲስቲክስ ላይ ተጽዕኖ ያሳድራል። ለምሳሌ፣ የሚከተለው የPROC CORR ጥሪ በ Orig_Height ተለዋዋጭ እና በክብደት እና ዕድሜ ተለዋዋጮች መካከል ያለውን ቁርኝት ያሰላል።

ለምንድነው ለጠፋ መረጃ አማካኝ መጠቀም መጥፎ ሀሳብ ነው?

አማካኝ የመረጃ ልዩነትን ይቀንሳል ወደ ሒሳብ በጥልቀት ከገባን ትንሽ ልዩነት ወደ የይምነት ስርጭት [3] የመተማመን ልዩነትን ያመጣል። ይህ ወደ ሞዴላችን አድልዎ ከማስተዋወቅ ወደ ሌላ ነገር አይመራም።

እሴቶች ችግር ለምን ጠፉ?

የጠፋ መረጃ የተለያዩ ችግሮችን ያሳያል። በመጀመሪያ፣ የመረጃ አለመኖር የስታቲስቲክስ ሃይልን ይቀንሳል፣ ይህ የሚያመለክተው ፈተናው ሐሰት ሲሆን ባዶ መላምትን ውድቅ የሚያደርግበትን ዕድል ነው። በሁለተኛ ደረጃ, የጠፋው መረጃ በመለኪያዎች ግምት ውስጥ አድልዎ ሊያስከትል ይችላል. ሦስተኛ፣ የናሙናዎችን ተወካይነት ሊቀንስ ይችላል።

ለምንድነው አማካይ ግምት መጥፎ የሆነው?

ችግር 1፡ አማካኝ ግምት በተለዋዋጮች መካከል ያለውን ግንኙነት አያቆይም። እውነት ነው፣ አማካኙን መቁጠር የተመለከተውን መረጃ አማካይ ይጠብቃል። ስለዚህ ውሂቡ በዘፈቀደ ሙሉ በሙሉ የሚጎድል ከሆነ፣ የአማካኙ ግምት ከአድልዎ የጸዳ ነው።

የጎደለውን ውሂብ በአማካኝ መተካት አለቦት?

Outliers ዳታ ነጥቦች በአማካይ ላይ ከፍተኛ ተጽእኖ ይኖራቸዋል ስለዚህም እንደዚህ ባሉ አጋጣሚዎች የጎደሉትን እሴቶች ለመተካት አማካኙን መጠቀም አይመከርም። የጎደሉትን እሴቶች ለመተካት አማካኝ እሴቶችን መጠቀም ጥሩ ሞዴል ላይፈጥር ይችላል እና በዚህም ይሰረዛል።

የሚመከር: