آمار رشته وسیعی از ریاضی است که راههای جمع آوری، خلاصه سازی و نتیجه گیری از داده‌ها را مطالعه می‌کند. این علم برای طیف وسیعی از علوم دانشگاهی از فیزیک وعلوم اجتماعی گرفته تا روان شناسی و غیره کاربرد دارد.. آمار، دانش استخراج اطلاعات از داده‌های جمع‌آوری شده‌است. داده‌ها ممکن است به صورت کمی (عدد و رقم) یا کیفی (صفت و ویژگی غیرعددی) جمع‌آوری شده باشند. دسته‌بندی و خلاصه‌سازی این داده‌ها کمک می‌کند‌ بتوانیم اطلاعات بیشتری از آن‌ها استخراج کنیم. می‌توان علم آمار را مرتبط با شیوه‌ها و روش‌های دسته‌بندی، خلاصه سازی، تحلیل و استنباط داده‌ها دانست.

آمار عمدتا با وضعیت هابی سر و کار دارد که در آنها وقوع یک پیشامد به طور حتمی قابل پیش بینی نیست. استنتاج های آماری غالبا غیر حتمی اند، زیرا مبتنی بر اطلاعات ناکاملی هستند.

آنالیز آماری

اصول پایه ای

جمع‌آوری داده‎ها، از طریق پرسشنامه یا اندازه‌گیری با ابزار یا شمارش و مصاحبه و… انجام می‌شود. بعد از این عمل، دسته‌بندی و خلاصه‌سازی برای ویژگی‌های اندازه‌گیری شده اهمیت دارد. استفاده از جداول آماری مانند جدول فراوانی، جدول فراوانی متقاطع، نمودارها و غیره روش‌هایی برای دسته بندی‌داده‌ها هستند. نمودارهای فراوانی (هیستوگرام)، نمودار پارتو، نمودار جعبه‌ای و نمودارهای دیگر، قابلیت نمایش خصوصیات جامعه آماری را به صورت تصویری دارند. همچنین برای شناخت بهتر جامعه آماری یا نمونه آماری، امکان محاسبه شاخص‌ها یا معیارهایی وجود دارد که به وسیله‌ی آن خصوصیات جامعه یا نمونه در یک مقدار (کمی یا کیفی) خلاصه شده، و مقایسه بین جامعه‌ها یا نمونه‌های مختلف را میسر می‌سازد.

هر پژوهش دارای دو وجه است؛ یکی طرح آزمایش و انجام آن و دیگری تـحلیل آماری داده ها که این دو موضوع در ارتباط نزدیک با یکدیگرند؛ زیرا تحلیل مستقیما به طرح مورد استفاده بستگی دارد. در طرح آزمایش چند نکته حایز اهمیت است:

  1. تکرار: منظور از تـکرار تهیه مشاهدات متـعدد در امتحان واحدهای آزمایش است . تکرار دو خاصیت مهم دارد :
    1. پژوهشگر را قادر می سازد که برآوردی از خطای آزمایش به دست آورد؛
    2. اگر بـرای برآورد سطحی از یک عامل به طور مثال از میانگین نمونه استفاده کنیم آن گاه تکرار موجب برآوری دقیق تر برای آن اثر می شود.
  2. تصـادفی کردن: منـظور از تـصادفی کردن تـخصیص تصادفی تیمارها به واحدهای آزمایشی است.
  3. بلوک بندی: تکنیکی است که برای افزایش دقت یک آزمایش استفاده می شود. استفاده از آن موجب می شود که علی رغم محدودیـت های واقـعی از انتـخاب تـصادفی واحدهای آزمـایشی بتـوانیم خطای آزمـایش را کاهش دهیم.

جمع‌آوری داده‎ها، از طریق پرسشنامه-اندازه‌گیری با ابزار اندازه‎گیری یا شمارش-مصاحبه و… انجام می‌شود. بعد از این عمل، دسته‌بندی و خلاصه‌سازی برای ویژگی‌های اندازه‌گیری شده اهمیت دارد. استفاده از جداول آماری مانند جدول فراوانی، جدول فراوانی متقاطع، نمودارها و غیره روش‌هایی برای دسته بندی‌داده‌ها هستند. نمودارهای فراوانی (هیستوگرام)، نمودار پارتو، نمودار جعبه‌ای و نمودارهای دیگر، قابلیت نمایش خصوصیات جامعه آماری را به صورت تصویری دارند. همچنین برای شناخت بهتر جامعه آماری یا نمونه آماری، امکان محاسبه شاخص‌ها یا معیارهایی وجود دارد که بوسیله‌ی آن خصوصیات جامعه یا نمونه در یک مقدار (کمی یا کیفی) خلاصه شده، و مقایسه بین جامعه‌ها یا نمونه‌های مختلف را میسر می‌سازد.

روش‌های آماری

هدف کلی برای یک پروژه تحقیقی آماری، بررسی حوادث اتفاقی بوده هم چنین نتیجه گیری روی تأثیر تغییرات در ارزش شاخص‌ها یا متغیرهای غیر وابسته روی یک پاسخ یا متغیر وابسته‌است. دو شیوه اصلی از مطالعات آماری تصادفی وجود دارد: مطالعات تجربی و مطالعات مشاهداتی. در هر دو نوع از این مطالعات، اثر تغییرات در یک متغیر (یا متغیرهای) غیر وابسته روی رفتار متغیرهای وابسته مشاهده می‌شود. اختلاف بین این دو شیوه درچگونگی مطالعه‌ای است که عملا هدایت می‌شود. یک مطالعه تجربی در بردارنده روش‌های اندازه گیری سیستم تحت مطالعه‌است که سیستم را تغییر می‌دهد و سپس با استفاده از روش مشابه اندازه گیری‌های اضافی انجام می‌دهد تا مشخص سازد که آیا تغییرات انجام شده، مقادیر شاخص‌ها را تغییر می‌دهد یا خیر. در مقابل یک مطالعه نظری، مداخلات تجربی را در بر نمی‌گیرد. در عوض داده‌ها جمع آوری می‌شوند و روابط بین پیش بینی‌ها و جواب بررسی می‌شوند. از جمله مهم‌ترین اهداف آمار، می‌توان تولید بهترین اطلاعات از داده‌های موجود و سپس استخراج دانش از آن اطلاعات را ذکر کرد.

جامعه و نمونه

جامعه یک بررسی آماری دارای مشاهده ها یا آزمایش هایی تحت شرایطی یکسان ، به عنوان عنصرهای خود است. هر یک از این عنصرها را میتوان نسبت به مشخصه های متفاوتی بررسی کرد ، که می توانند به عنوان متغیرهای تصادفی XوY .... در نظر گرفته شوند. انتخاب نمونه باید تصادفی یا نماینده ای باشد . انتخاب تصادفی انتخابی است که در آن هر عنصر برای اینکه عضو آن نمونه باشد یا نباشد ، از احتمال یکسان برخوردار است.

حجم نمونه:

در انجام تحلیل‌های آماری، در بیشتر مواقع از نمونه آماری بهره می‌بریم. این کار البته باعث می‌شود که مقداری از اطلاعات که در جامعه آماری وجود دارد، نادیده گرفته شده و برآوردها و تخمین‌هایی که برای پارامتر جامعه آماری محاسبه می‌شوند با خطا همراه باشد. به منظور کاهش خطا به میزان مورد نظر و افزایش میزان اعتبار نتایج از تحلیل‌های آماری باید تعداد مناسبی نمونه انتخاب شود. از آنجایی که افزایش حجم نمونه باعث افزایش هزینه‌ و زمان تحلیل آماری می‌شود،‌ باید به حداقل حجم نمونه‌ای که خطایی معقول در برآورد پارامترهای جامعه دارد، قناعت کنیم.

آنالیز آماری

در بررسی یک مسئله با روش های آماری ، باید نقشه آزمایش کشیده شود که شامل روش جمع آوری داده ها،اندازه نمونه مورد نظر و روش حل آن مسئله است. در این مورد هر چه نقشه آزمایش دقیق تر باشد ، نتایج به دست آمده از روش های آماری بهتر خواهند بود . بخصوص ، باید اطمینان حاصل شود که هیچ یک از اندازه گیری هایی که برای نتایج مورد نظر دارای اهمیت اند از قلم نیفتند یا ناقص نباشند...

اما در این مورد همچنین می توان ، تنها به همان اندازه که می شود با بخش ناچیزی از هزینه ها به دست آورد قناعت و از دستاوردی با یک رشته آزمون بسیار پرخرج اجتناب کرد.

نرم‌افزارها:

با توجه به تنوع روش‌ها و پیچیدگی محاسبات در تحلیل‌های آماری، استفاده از نرم‌افزارهای رایانه‌ای گریز ناپذیر است. از طرفی نرم‌افزارهای مختلفی برای انجام چنین تحلیل‌های توسعه یافته‌اند. بنابراین انتخاب نرم‌افزار مناسب که مطابق با نیازها و احتیاج ما باشد، امری ضروری به نظر می‌رسد. برخی نرم افزارهای آماری آنقدر گسترش و محبوبیت دارند که برخی افراد آمار را با نام این نرم افزارها می شناسند مانند SPSS.

آنالیز آماری

قابلیت های SPSS به شرح زیر است:

  • تهیه خلاصه های آماری مانند گراف ها، جداول ، آماره ها و ...
  • انواع توابع ریاضی مانند قدر مطلق، تابع علامت، لگاریتم، توابع مثلثاتی و ...
  • تهیه انواع جداول سفارشی مانند جداول فراوانی، فراوانی تجمعی، درصد فراوانی و ...
  • انواع توزیع های آماری شامل توزیع های گسسته و پیوسته
  • تهیه انواع طرح های آماری
  • انجام آنالیز واریانس یکطرفه، دوطرفه، چندطرفه و آنالیز کوواریانس
  • تکنیک های تجزیه و تحلیل سری های زمانی
  • ایجاد داده های تصادفی و پیوسته
  • محاسبه انواع آماره های توصیفی
  • انواع آزمون های مرتبط با مقایسه میانگین بین دو یا چند جامعه مستقل و وابسته
  • قابلیت مبادله اطلاعات با نرم افزارهای دیگر
  • برازش انواع مختلف رگرسیون

زمانی که داده ها از مدل های غیر نرمال با حجم کم و یا تکرار زیاد برخوردار هستند، روش های آماری معمول برای تحلیل داده ها کافی نمی باشد. بدیهی است نرم افزار SPSS هم قادر به انجام تحلیل ها نمی باشد. نرم افزارهای پیشرفته آماری از جمله R ، SAS ، Minitab، Stata از محبوت ترین و کامل ترینآن ها می باشند. از جمله مزایای آن ها می توان به موراد زیر اشاره کرد:

  • زبان برنامه‌نویسی و محیط نرم‌افزاری برای محاسبات آماری و علم داده‌ها.
  • زبان برنامه‌نویسی ساده و پیشرفته شامل عبارت‌های شرطی ،حلقه و توابع بازگشتی و …
  • نرم‌افزار قدرتمندی با امکانات گرافیکی برای تجزیه‌وتحلیل داده‌ها، رسم نمودار و ایجاد اشکال.
  • حاوی محدوده گسترده‌ای از تکنیک‌های آماری.
  • بسته‌های نرم‌افزاری قدرتمند برای تجزیه‌وتحلیل آماری.
  • توانایی انجام محاسبات ماتریسی.
  • کتابخانه‌های انجام عملیات داده‌کاوی و یادگیری ماشین مانند دسته‌بندی، خوشه‌بندی، تحلیل شبکه اجتماعی، یادگیری تقویتی و…
  • کتابخانه‌های خاص برای انجام عملیات تحلیلی در زمینه‌های مختلف علمی.
  • دارای مستندات فرمت بندی شده و منظم برای استفاده از زبان و کتابخانه‌های مرتبط.
  • امکان توسعه قابلیت‌های آن ها، با افزودن بسته‌های ایجادشده توسط کاربران خبره.
  • دارای محیط خط فرمان برای ورود و اجرای دستورات.
  • امکانات ذخیره ،بازیابی و دست‌کاری داده‌ها.

در آزمایشگاه آتیه درخشان ذهن متخصصین آمار آماده ی ارائه ی مشاوره در زمینه ی طراحی طرح آزمایشی و همچنین آنالیز داده های پژوهشگران هستند.