رگرسیون لجستیک

ساخت وبلاگ

رگرسیون لجستیک طبقه ای از رگرسیون است که در آن از متغیر مستقل برای پیش بینی متغیر وابسته استفاده می شود. هنگامی که متغیر وابسته دو دسته دارد ، آنگاه یک رگرسیون لجستیک باینری است. هنگامی که متغیر وابسته بیش از دو دسته دارد ، آنگاه یک رگرسیون لجستیک چندمجمی است. هنگامی که دسته متغیر وابسته قرار می گیرد ، یک رگرسیون لجستیک ترتیب (OLS) است. برای به دست آوردن برآورد حداکثر احتمال ، متغیر وابسته را در عملکرد ورود به سیستم تغییر دهید. Logit اساساً یک سیاهه طبیعی از متغیر وابسته است و می گوید که آیا این رویداد رخ خواهد داد یا خیر. رگرسیون لجستیک معمولی رابطه خطی بین متغیر وابسته و مستقل فرض نمی کند. این همجنسگرایان را فرض نمی کند. آمار والد اهمیت متغیر مستقل فردی را آزمایش می کند.

فرضیات: این آزمایش محبوب است زیرا می تواند بسیاری از فرضیات محدود کننده رگرسیون OLS را بر طرف کند.

  1. در رگرسیون OLS ، یک رابطه خطی بین متغیر وابسته و مستقل ضروری است ، اما در رگرسیون لجستیک ، چنین مواردی را فرض نمی کند. رابطه بین متغیر وابسته و مستقل ممکن است خطی یا غیر خطی باشد.
  2. OLS فرض می کند که توزیع باید به طور عادی توزیع شود ، اما در رگرسیون لجستیک ، توزیع ممکن است طبیعی ، پواسون یا دوتایی باشد.
  3. OLS فرض می کند که بین همه متغیرهای مستقل واریانس مساوی وجود دارد ، اما لجستیک معمولی فرض نمی کند که بین متغیرهای مستقل واریانس مساوی وجود دارد.
  4. واریانس اصطلاح خطای عادی توزیع شده را فرض نمی کند.

request a consultation

کشف کنید که چگونه ما به ویرایش فصل های پایان نامه خود کمک می کنیم

تراز چارچوب نظری ، جمع آوری مقالات ، ترکیب شکافها ، بیان یک روش روش شناسی و برنامه داده روشن ، و نوشتن در مورد پیامدهای نظری و عملی تحقیق شما بخشی از خدمات جامع ویرایش پایان نامه ما است.

  • تخصص ویرایش پایان نامه را به موقع به فصل های 1-5 بیاورید.
  • همه تغییرات را پیگیری کنید ، سپس با شما همکاری کنید تا نوشتن علمی را به وجود آورید.
  • پشتیبانی مداوم برای پرداختن به بازخورد کمیته ، کاهش تجدید نظر.

با این وجود ، نقض این فرضیات OLS در رگرسیون لجستیک موارد زیر را فرض می کند:

  • سطح داده ها: متغیر وابسته باید برای رگرسیون باینری از نظر طبیعت دوگانگی باشد.
  • اصطلاح خطا: اصطلاح خطا به طور مستقل فرض می شود.
  • خطی: رابطه خطی را فرض نمی کند ، بلکه بین نسبت عجیب و غریب و متغیر مستقل ، باید یک رابطه خطی وجود داشته باشد.
  • هیچ خارج از کشور: فرض کنید که نباید در داده ها مسافتی وجود داشته باشد.
  • نمونه بزرگ: از روش حداکثر احتمال استفاده می کند ، بنابراین اندازه نمونه بزرگ برای رگرسیون لجستیک مورد نیاز است.

اصطلاحات و مفاهیم کلیدی:

  • متغیر وابسته: از نظر طبیعت دوگانگی ، برای متغیرهای وابسته به رگرسیون باینری در دو دسته قرار دارند. معمولاً با در نظر گرفتن دسته مرجع پایین (فرض شده به عنوان 0) ، دسته بالاتر (فرض شده به عنوان 1) را پیش بینی می کنیم. در رگرسیون لجستیک چندمجمی ، متغیر وابسته بیش از دو دسته دارد. ما می توانیم دسته دیگر را بر اساس گروه مرجع پیش بینی کنیم. در رگرسیون لجستیک معمولی ، احتمال تجمعی ترتیب متغیر وابسته را پیش بینی می کنیم.
  • فاکتور: متغیر مستقل از نظر طبیعت دوگانگی است و عامل آن نامیده می شود. معمولاً آنها را به یک متغیر ساختگی تبدیل می کنیم.
  • متغیر: متغیر مستقل که از نظر طبیعت متریک است ، متغیرهای متغیر نامیده می شود.
  • اصطلاح تعامل: متغیرهای متغیر تأثیر فردی را بر متغیر وابسته نشان می دهد. اثر متقابل ترکیبی از دو اثر متغیر بر متغیر وابسته است. به عنوان مثال ، هنگامی که متغیر وابسته را بر اساس گروه سن و تحصیلات پیش بینی می کنیم ، دو تأثیر خواهد داشت: یکی تأثیر فردی بر متغیر وابسته و دیگری تأثیر تعامل است.
  • حداکثر برآورد احتمال: از این روش برای پیش بینی نسبت عجیب و غریب برای متغیر وابسته استفاده می شود. در برآورد OLS ، ما مقدار خطای فاصله مربع را به حداقل می رسانیم ، اما در برآورد حداکثر احتمال ، احتمال ورود به سیستم را به حداکثر می رسانیم.
  • SPSS و SAS: در SPSS ، این آزمون در گزینه رگرسیون موجود است و در SAS می توانیم با استفاده از "Command Proc Logistic" یا "Proc Catmod" از این روش استفاده کنیم.
  • آزمون اهمیت: از آزمون مجذور Hosmer و Lemeshow برای آزمایش مدل کلی آزمون خوب بودن استفاده می شود. این تست مجذور کای اصلاح شده است که بهتر از تست سنتی کای مربع است. مقدار p قابل توجه مدل خوب بودن را نشان می دهد. جدول تست های Omnibus در خروجی SPSS مقدار سنتی کای و هومر و لیمشو را نشان می دهد. آزمون تست مجذور Pearson chi-square و نسبت احتمالاً در رگرسیون لجستیک چندمجمی برای برآورد مدل خوب بودن مدل استفاده می شود.
  • گام به گام: سه روش موجود وارد ، عقب و رو به جلو است. در روش enter ، تمام متغیرها شامل می شوند ، چه قابل توجه و چه ناچیز. در روش عقب ، شروع به رها کردن متغیرهای غیر مهم از لیست می کند. در روش رو به جلو ، ضمن رها کردن متغیرهای غیر مهم ، به جلو حرکت می کند.
  • برآورد پارامتر و ورود به سیستم: در خروجی آماری SPSS ، "برآورد پارامتر" ضریب B است که برای پیش بینی شانس ورود به سیستم (ورود) متغیر وابسته استفاده می شود. بگذارید z برای یک متغیر وابسته باشد ، سپس معادله پیش بینی لجستیک:

z = ln (شانس (رویداد)) = ln (prob (رویداد)/prob (nonevent)) = ln (prob (رویداد)/) = b0 + b1x1 + b2x2 +… .. + bkxk

جایی که B0 ثابت است و K متغیرهای مستقل (X) است. در رگرسیون لجستیک معمولی ، ضریب آستانه برای هر ترتیب متغیرهای وابسته متفاوت خواهد بود. ضریب احتمال تجمعی هر ترتیب متغیرهای وابسته را به شما می دهد.

  • نسبت عجیب و غریب: بتا نمایی نسبت عجیب متغیر وابسته را نشان می دهد. ما می توانیم احتمال متغیر وابسته را از این نسبت عجیب و غریب پیدا کنیم. هنگامی که مقدار بتا نمایی بیشتر از یک باشد ، از احتمال افزایش مقوله بالاتر ، و اگر احتمال بتا نمایی کمتر از یک باشد ، احتمال اینکه طبقه بالاتر کاهش یابد. مقدار بتا نمایی با دسته مرجع تفسیر می شود ، جایی که احتمال متغیر وابسته افزایش یا کاهش می یابد. در متغیرهای مداوم ، با افزایش یک واحد در متغیر مستقل ، مربوط به افزایش یا کاهش واحدهای متغیر وابسته ، تفسیر می شود.
  • اقدامات اندازه اثر: R 2 بیشتر پذیرفته نمی شود زیرا R 2 استخراج واریانس توسط متغیر مستقل را به ما می گوید ، اما در اینجا ، واریانس به دو دسته تقسیم می شود. R 2 Cox و Snell ، R 2 Nagelkerke ، R 2 McFadden و Pseudo-R 2 اکنون قابل تحقق تر از R 2 ساده هستند.
  • جدول طبقه بندی: جدول طبقه بندی نشان می دهد که چگونه این دو دسته به درستی پیش بینی شده اند. به عنوان مثال ، از دو دسته ، فقط 85 ٪ به درستی پیش بینی شده بودند ، این در جدول طبقه بندی نشان داده شده است.

منابع

آلیسون ، P. D. (1999). مقایسه ضرایب ورود و پروبیت در گروه ها. روش ها و تحقیقات جامعه شناختی ، 28 (2) ، 186-208.

Demaris ، A. (1992). مدل سازی logit: برنامه های کاربردی. Newbury Park ، CA: انتشارات SAGE.

گرینلند ، S. ، شوارتزباوم ، J. A. ، و Finkle ، W. D. (2000). مشکلات به دلیل نمونه های کوچک و داده های پراکنده در تجزیه و تحلیل رگرسیون لجستیک مشروط. مجله آمریکایی اپیدمیولوژی ، 151 (5) ، 531-539.

Hosmer ، D. W. ، & Lemeshow ، S. (2000). رگرسیون لجستیک کاربردی (ویرایش دوم). نیویورک: جان ویلی و پسران.

Jaccard ، J. (2001). اثرات متقابل در رگرسیون لجستیک. هزار اوکس ، کالیفرنیا: انتشارات مریم گلی.

Kleinbaum ، D. G. ، Klein ، M. ، & Pryor ، E. R. (2004). رگرسیون لجستیک: یک متن خودآموز (ویرایش دوم). نیویورک: اسپرینگر.

مک فادن ، د. (1974). تجزیه و تحلیل ورود مشروط از رفتار انتخاب کیفی. در P. Zarembka (ویرایش) ، مرزهای اقتصاد سنجی (صص 105-142). نیویورک: انتشارات دانشگاهی.

منارد ، س. (2002). تجزیه و تحلیل رگرسیون لجستیک کاربردی (ویرایش دوم). هزار اوکس ، کالیفرنیا: انتشارات مریم گلی.

O'Connell ، A. A. (2005). مدل های رگرسیون لجستیک برای متغیرهای پاسخ معمولی. هزار اوکس ، کالیفرنیا: انتشارات مریم گلی.

Pedhazur ، E. J. (1982). رگرسیون چندگانه در تحقیقات رفتاری. نیویورک: هولت ، راینهارت و وینستون.

پنگ ، C. -Y. J. ، Lee ، K. L. ، & Ingersoll ، G. M. (2002). مقدمه ای برای تجزیه و تحلیل و گزارش رگرسیون لجستیک. مجله تحقیقات آموزشی ، 96 (1) ، 3-14.

Press ، S. J. ، & Wilson ، S. (1978). انتخاب بین رگرسیون لجستیک و تجزیه و تحلیل تبعیض آمیز. مجله انجمن آماری آمریکا ، 73 (364) ، 699-705.

صفحات مرتبط:

  • انجام و تفسیر رگرسیون لجستیک
  • رگرسیون لجستیک چیست؟
  • تجزیه و تحلیل رگرسیون لجستیک در SPSS
منصة التداول الأكثر ثقة...
ما را در سایت منصة التداول الأكثر ثقة دنبال می کنید

برچسب : نویسنده : احمد نجفی بازدید : 36 تاريخ : يکشنبه 12 شهريور 1402 ساعت: 22:28