ADs by Techtunes ADs
ADs by Techtunes ADs

Regression, Correlation এবং Chi Square Test করুন R প্রোগ্রামিং এর মাধ্যমে

যারা বিশ্ববিদ্যালয় পর্যায়ে পড়াশোনা করছে, অথবা যারা গবেষণার কাজে জড়িত, কিংবা ডাটা এনালিস্ট যারা, তাদের জন্য গুরুত্বপূর্ণ তিন ধরনের এনালাইসিস হলো regression analysis, correlation এবং Chi Square Test। জটিল ধারণাগুলো খুব সহজ করে বললে, রিগ্রেশন প্রয়োজন হয় একটি উপাত্তের প্রেক্ষিতে আরেকটি উপাত্তের পরিবর্তন নির্ণয় করতে, কোরিলেশন করতে হয় দু'টো উপাত্তের মধ্যে সম্পর্কের প্রকৃতি নির্ধারণ করতে এবং সম্পর্ক আদৌ আছে কিনা সেটা নির্ধারণ করা হয় কাই স্কয়ার টেস্ট থেকে।

ADs by Techtunes ADs

এই তিনটে এনালাইসিস করতে আমরা বিভিন্ন ধরনের সফটওয়্যার ব্যবহার করি। সবচেয়ে জনপ্রিয় হলো SPSS সফটওয়্যার। মাইক্রোসফট এক্সেল দিয়েও করা যায় কাজগুলো (সময় সাপেক্ষ)। STATA, MATLAB এবং অন্যান্য এনালিটিক্যাল সফটওয়্যার দিয়েও করা যায়। তবে R প্রোগ্রামিং ল্যাঙ্গুয়েজ দিয়ে করাটা সম্ভবত সবচেয়ে সহজ এবং ফলপ্রসু; আমার ব্যক্তিগত অভিজ্ঞতা যা বলে।

যাদের R নেই, তারা R cran থেকে এটা ডাউনলোড করে নিতে পারেন। এটি ফ্রি, ওপেন সোর্স। তারপর নিচের কোডগুলো ব্যবহার করলেই হবে।

 

Regression Analysis:

নিচের কোডগুলো ফলো করুন।

  • For Regression Result (a=dependent, b=independent): Regression=lm(a~b,data=df)
  • For Regression Plot: xyplot(a~b,data=df,xlab="Weight",ylab="height",main="Relation between height and Weight")
  • For Details: summary(Regression)
  • For linear graph: qqmath(a~b,data=df,xlab="Wieght",ylab="height",main="relation")

lattice package প্রয়োজন xyplot function এর জন্য। library(lattice) লিখে এটা চালু করে নিন। না থাকলে install.packages("lattice") লিখে ডাউনলোড করে তারপর library(lattice) লিখুন। এখানে উল্লেখ্য, a এবং b ভেক্টরকে ডিফাইন করে নিতে হবে আপনার ডাটা সেট অনুযায়ী। আর ডাটাফ্রেম তৈরি করতে হবে data.frame() কমান্ডের মতো।

 

Correlation Analysis:

নিচের কোডগুলো ফলো করুন।

ADs by Techtunes ADs
  • library(ggpubr)
  • library(devtools)
  • For simplified correlation: after defining a and b: cor(a,b)
  • For details correlation with significance value: cor.test(a,b)
  • For Pearson correlation: cor.test(a,b,method="pearson")
  • For Kendall correlation: cor.test(a,b,method="kendall")
  • For Spearman Correlation: cor.test(a,b,method="spearman")
  • For correlation graph: ggscatter(df, x="Weight", y="Height",add = "reg.line",conf.int = TRUE,cor.coef = TRUE, cor.method = "spearman",xlab = "Height", ylab = "Weight", main="Correlation")

 

Chi Square Test:

নিচের কোড ফলো করুন।

  • chisq.test(my_data$Week_Weekend,my_data$Gender,correct = FALSE)

এখানে correct=FALSE লেখাটা গুরুত্বপূর্ণ।  এছাড়া আপনার ডাটাসেট অনুযায়ী ভ্যারিয়েবলগুলো ইচ্ছেমতো ডলার সাইন দিয়ে পরিবর্তন করতে পারবেন।

 

পুরো কোডিং টা আমি R এ সেভ করে রেখেছি। সেটা ডাউনলোড করে শুধু ctrl+Enter দিয়ে দিয়ে, আপনার প্রয়োজন মতো কমান্ড এডিট করে কাজ করে নিতে পারেন।

আর ফাইল ডাউনলোড লিংকঃ http://www.mediafire.com/file/fcest7f7z8ggbj5/R+script+by+Bappy.R

ADs by Techtunes ADs
Level 0

আমি মোহাইমিনুল ইসলাম বাপ্পী। বিশ্বের সর্ববৃহৎ বিজ্ঞান ও প্রযুক্তির সৌশল নেটওয়ার্ক - টেকটিউনস এ আমি 3 বছর যাবৎ যুক্ত আছি। টেকটিউনস আমি এ পর্যন্ত 1 টি টিউন ও 0 টি টিউমেন্ট করেছি। টেকটিউনসে আমার 1 ফলোয়ার আছে এবং আমি টেকটিউনসে 0 টিউনারকে ফলো করি।


টিউনস


আরও টিউনস


টিউনারের আরও টিউনস


টিউমেন্টস