رگرسیون لجستیک فهرست مطالب
فصل اول: مقدمه اي بر الگوهاي خطي تعميم يافته 1
1-1- الگوهاي خطي : 1
1-2-الگوهاي غير خطي : 3
1-3- الگوهاي خطي تعميم يافته : 3
1-4- رگرسيون لجستيك حالت خاصي از رده الگوهاي خطي تعميم يافته: 5
فصل دوم: رگرسيون لجستيك 7
2-1ـ مفهوم كلي متغيرهاي نشانگر : 7
2-2- مدلهاي رگرسيوني با يك متغير پاسخ نشانگر : 7
2-3- الگوي رگرسيوني كه واريانس تابعي از ميانگين است : 8
2-4- يك مدل خطي : 10
2-5- يك مدل غيرخطي : 11
2-6- چند خاصيت منحني لجيت : 14
2-7- فرضهايي كه در رگرسيون لجستيك وجود ندارد : 14
2- 8 – فرضهايي كه در رگرسيون لجستيك وجود دارند : 15
فصل سوم : براورد پارامترهاي مدل رگرسيون لجستيك 16
3-1- برآورد پارامتر با استفاده از درستنمايي ماكزيمم : 16
3-2- رابطه بين برآورد درستنمايي ماكزيمم الگوي رگرسيون لجستيك و كمترين مربعات موزون : 19
فصل چهارم : استنباط هاي آماري با استفاده از رگرسيون لجستيك 23
4-1- استنباط والد وقتي از رگرسيون لجستيك استفاده ميكنيم : 23
4-2- استنباط درستنمايي در رگرسيون لجستيك : 26
فصل پنجم :نرم افزار SAS و رگرسيون لجستيك 29
فصل ششم: 34
مثال 6-1 34
مثال 6-2 46
منابع : 53
فصل اول:
مقدمه اي بر الگوهاي خطي تعميم يافته
تحليل رگرسيوني، فن و تكنيكي آماري براي بررسي و به مدل در آوردن ارتباط بين متغيرهاست. كاربردهاي رگرسيون، متعدد است. و تقريباً در هر زمينه اي از جمله مهندسي و فيزيك، اقتصاد، مديريت، علوم زيستي و بيولوژي و علوم اجتماعي صورت ميپذيرد. در حقيقت تحليل رگرسيوني ممكن است فن و تكنيكي آماري با بيشترين و وسيعترين كاربرد بين تكنيكهاي آماري باشد.
منظور از مدل بندي يا مدل كردن يك فرآيند، در نظر گرفتن يك مدل رياضي بصورت يك معادله به منظور نشان دادن رفتار و روند كلي آن فرآيند ميباشد. و رگرسيون يكي ازمهمترين و پركاربدترين انواع مدل بندي در آمار است كه به دو صورت خطي و غير خطي مطرح ميشود.
1-1- الگوهاي خطي :
مدلي را مدل خطي ميگويند كه تابعي خطي بر حسب پارامترهاي خود باشد. مثلاًَ مدلهاي زير خطي هستند:
كه در آنها متغير پاسخ يا برآمد، مجموعه اي از متغيرهاي پيشگو يا برگشت، مجموعه پارامترهاي نامعلوم و جمله خطاي تصادفي است. گاهي اوقات متغيرهاي برگشت را متغير كمكي مينامند. ما نوعاً فرض ميكنيم كه جمله خطاي داراي ميانگين صفر است. بنابراين، ميانگين پاسخ در الگوي رگرسيون خطي عبارتند از:
از الگوهاي رگرسيون خطي به دلايل گوناگوني، زياد استفاده ميشود. اول اينكه مدلهاي خطي اغلب مدلهاي تجربي و عملي تري براي تحليل فرآيندهاي پيچيده و بطور كلي مدل كردن پديدههاي ناشناخته محسوب ميشوند. از طرفي تحليل مدلهاي خطي نيز به مراتب آسانتر از تحليل مدلهاي غيرخطي است.
دومين دليل مشهود بودن الگوهاي رگرسيون خطي اين است كه از آنها پارامترهاي مجهول مستقيماً برآورد ميشوند. روش كمترين مربعات يك تكنيك برآورد پارامتر است كه به اوايل قرن نوزدهم بر ميگردد. وقتي از اين روش در يك الگوي خطي استفاده ميشود، تحليلگر بايد فقط يك مجموعه مركب از معادله خطي را نسبت به مجهول حل كند. امروزه ماشينهاي محاسبه كننده دستي و برنامههاي رايانه اي روش كمترين مربعات را براي الگوهاي خطي انجام ميدهند، از اين رو برازش مدل رگرسيون بسيار آسان است. سرانجام اينكه يك نظريه آماري واقعاً جالب و توسعه يافته براي الگوي خطي وجود دارد.
اگرخطاهاي در الگوي خطي را داراي توزيع نرمال مستقل با واريانس ثابت فرض كنيم آنگاه آزمونهاي آماري و فواصل اطمينان مربوط به پارامترهاي الگو و فواصل پيشگويي و اطمينان براي پاسخ را ميتوان به سهولت بدست آورد. علاوه بر اين، اين روشها به خوبي در بسياري از بستههاي نرم افزارآماري انجام داده شده و لذا به آساني اجرا ميشود.
در ضمن در آموختن الگوهاي خطي تعميم يافته، بايد برخي از نظريهها و جنبههاي علمي استفاده از رگرسيون خطي را مد نظر قرار دهيم……………………………….