۴- جمله خطا به صورت نرمال توزیع شده است.
نکته قابل ذکر این است که در این پژوهش چندین رگرسیون چند متغیره آزمون می‌شود.
۳-۱۰-۲- نبود خود همبستگی
در مدل­های رگرسیون فرض بر آن است که جملات خطا (یعنی تفاوت بین مقادیر واقعی و مقادیر پیش ­بینی شده توسط معادله رگرسیون) از دوره‌ای به دوره بعد مستقل می‌باشند، اما در بسیاری موارد، جملات خطا در دوره‌های مختلف همبسته‌اند. به عبارت ساده­تر در صورتی که داده ­های مورد استفاده در رگرسیون، در طول زمان جمع­آوری شده باشند این امکان وجود دارد که مقدار y در زمان t، که آن را با نماد yt نشان می­دهیم، با مقدار yدر زمان yt-1، ارتباط داشته باشد، در چنین مواردی جملات خطا اصطلاحاً دارای خود همبستگی[۵۹] یا همبستگی متوالی[۶۰] هستند. خود همبستگی جملات خطا در مطالعات سری­های زمانی مشاهده می‌شود. برخی از دلایل وجود خود همبستگی در جملات خطا عبارتند از (زارع، ۱۳۸۱، ۹۷ و ذوالنور، ۱۳۷۴، ۸۰):
۱- متغیرهای توضیحی حذف شده: در چنین حالتی، از آن­جایی که اغلب متغیرهای اقتصادی خود همبسته می‌باشند، خطای خود همبستگی به وجود می‌آید، گنجانیدن متغیرهای توضیحی حذف شده در مدل، این مشکل را برطرف می کند.
۲- مدل­بندی اشتباه یک الگو: اگر الگویی خاص را خطی فرض نماییم، در حالی که شکل واقعی آن غیرخطی است، خطاها می‌توانند منعکس کننده برخی وابستگی‌ها باشند.
۳- تحریف مشاهدات آماری: برخی داده‌های سری­های زمانی شامل نوعی از فرایند هموارسازی می­باشند که توزیع واقعی داده‌ها در خلال دوره‌های مورد بررسی را به صورت میانگین متحرک درآورده و برای مثال آثار فصلی آن را در یک سری زمانی از بین می‌برند. در نتیجه برای چنین متغیری، مقادیر می‌توانند با یکدیگر همبستگی پیدا کنند. وجود خود همبستگی در جملات خطای مدل رگرسیون منجر به نتایج زیر می‌شود (زارع، ۱۳۸۱، ۱۰۰ و ذوالنور، ۱۳۷۴، ۸۵-۸۶):

( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

الف) ضرایب رگرسیون کماکان برآورد کننده‌های نااریب[۶۱] می‌باشند، اما ویژگی­های واریانس حداقل را ندارند. این برآورده کننده‌ها نسبتاً ناکارا می‌باشند.
ب) میانگین مربعات جملات خطا، می‌تواند به صورتی قابل­ توجه واریانس واقعی جملات خطا را کم برآورد نماید.
ج) شیوه‌های فاصله اطمینان و آزمون­ها که در آن­ها از توزیع‌های t و F استفاده می‌شود، اکیداً قابل کاربرد نیستند.
د) در نتیجه اریب بودن میانگین مربعات جملات خطا، نیز غیر قابل اتکا و اریب خواهد بود.
برای بررسی آن­ که در یک مدل رگرسیون، جملات خطا خود همبسته می‌باشند یا خیر، آزمون­هایی طراحی شده است. در این میان آزمونی که بیش­تر مورد استفاده قرار می‌گیرد، آزمون دوربین- واتسن[۶۲] است. آزمون دوربین- واتسن بر مدل خطای خود همبسته مرتبه اول مبتنی می‌باشد. این مدل به صورت زیر است:
(۳-۱۰)
که در این معادله:
پارامتر خود همبستگی با مقدار و متغیر مستقل با فرض .
در این مدل وقتی که مثبت باشد، خود همبستگی مثبت و وقتی که منفی باشد، خود همبستگی منفی وجود دارد. در حالت خود همبستگی وجود ندارد (ذوالنور، ۱۳۷۴، ۸۶-۸۸).
۳-۱۰-۳- ضریب تعیین و ضریب تعیین تعدیل شده
ضریب تعیین معیاری است که قوت رابطه میان متغیر مستقل و متغیر وابسته را تشریح می‌کند. مقدار این ضریب در واقع مشخص کننده آن است که چند درصد از تغییرات متغیر وابسته توسط متغیر مستقل توضیح داده می‌شود و هر چه مقدار آن بیشتر باشد، خطاها کمتر و مدل رگرسیون قابل اعتماد تر است. مقدار از رابطه زیر تعیین می‌شود (پیندیک و روبینفیلد، ۱۳۷۰، ۱۱۲):
(۳-۱۱)
که در آن:
SSE = تغییرات جمله خطا که توسط رگرسیون توضیح داده نمی‌شود.
SST = کل تغییرات در مقدار متغیر وابسته.
با این حال اغلب ترجیح داده می‌شود که از مقیاس دیگری به نام ضریب تعیین تعدیل شده[۶۳] برای بررسی نیکویی برازش[۶۴] مدل رگرسیون چند متغیره استفاده کنند. این ضریب همان ضریب تعیین است که در آن مقادیر SST و SSE با درجات آزادی­شان تعدیل گردیده‌اند. این ضریب در رگرسیون چند متغیره به صورت زیر محاسبه می‌شود (همان، ص: ۱۱۳):
(۳-۱۲)
که در آن n تعداد مشاهدات و k تعداد متغیرهای مستقل است. در واقع هدف از به‌کارگیری تعدیل شده، تسهیل در مقایسه نیکویی برازش چندین معادله رگرسیون است که از نظر تعداد متغیرهای مستقل توضیحی متفاوتند.
۳-۱۰-۴- آزمون معنی­دار بودن در الگوی رگرسیون
در رگرسیون چندگانه دو یا چند متغیر مستقل وجود دارد و لازم است که برای مشخص شدن معنی­دار بودن آن­ها، دو آزمون انجام گیرد. ابتدا آزمون معنی­دار بودن معادله رگرسیون و در مرحله بعد آزمون معنی­دار بودن هر کدام از ضرایب متغیرهای مستقل در معادله بیان خواهد شد.
۳-۱۰-۴-۱- آزمون معنی­دار بودن معادله رگرسیون
در یک معادله رگرسیون چندگانه، چنان­چه هیچ­گونه رابطه‌ای میان متغیر وابسته و متغیرهای مستقل وجود نداشته باشد، می‌بایست تمامی ضرایب متغیرهای مستقل در معادله، مساوی صفر باشند. بدین ترتیب ما می‌توانیم معنی­دار بودن معادله رگرسیون را آزمون کنیم. این کار با بهره گرفتن از آماره F با فرض‌های زیر صورت می‌گیرد (عباسی­نژاد، ۱۳۸۰، ۸۹ و ذوالنور، ۱۳۷۴، ۵۶-۵۹):
معادله رگرسیون معنی­دار نیست معادله رگرسیون معنی­دار است
چنان­چه در سطح اطمینان ۹۵% (خطای ۵%= ) آماره F محاسبه شده از معادله رگرسیون کوچک­تر از مقدار F بدست آمده از جدول باشد فرض را نمی­ توان رد کرد و در غیر این صورت رد می‌شود. واضح است که در صورت رد شدن ، معادله رگرسیون معنی­دار خواهد بود.
۳-۱۰-۴-۲- آزمون معنی­دار بودن ضرایب رگرسیونی
بعد از آزمون معنی­دار بودن رگرسیون، بایستی معنی­دار بودن هر کدام از ضرایب آزمون گردد. هدف از انجام این آزمون آن است که مشخص شود آیا در سطح اطمینان مورد نظر ضریب محاسبه شده مخالف صفر است یا خیر؟ فرض­های این آزمون به شرح زیر است (ذوالنور، ۱۳۷۴، ۵۴-۵۶):
ضریب جامعه صفر است
ضریب جامعه مخالف صفر است
برای آزمون این فرضیه ­ها از آماره t استفاده می‌شود. اگر در سطح اطمینان ۹۵% (خطای ۵%=) آماره بدست آمده از آزمون کوچک­تر از t بدست آمده از جدول با همان درجه آزادی باشد، فرض تأیید شده و در غیر این صورت رد می‌شود. در این آزمون عدم رد به مفهوم بی ­معنی­ بودن ضریب مورد نظر و رد به معنی معنی­دار بودن ضریب مورد نظر است.
۳-۱۰-۵- روش استفاده از داده‌ها
معمولاً استفاده از داده ­های آماری به سه روش مقطعی[۶۵]، سری زمانی[۶۶] و ترکیبی/تلفیقی[۶۷] امکان­ پذیر است:
۱- داد­ه­های مقطعی: در داده ­های مقطعی، مقادیر یک یا چند متغیر برای چندین واحد اقتصادی (مشاهدات نمونه ­ای) برای یک زمان مشخص جمع­آوری می­ شود.
۲- داده ­های سری زمانی: در داده ­های سری زمانی، مقدار یک یا چند متغیر در طول یک دوره زمانی مشاهده می­ شود.
۳- داده ­های ترکیبی/تلفیقی: در داده ­های ترکیبی/تلفیقی، عناصر هر دو دسته از داده ­های سری زمانی و مقطعی وجود دارد، یعنی اطلاعات مربوط به داده ­های مقطعی در طول زمان مشاهده می­ شود. به بیان دیگر، چنین داده­هایی دارای دو بعد می­باشند که یک بعد آن مربوط به واحدهای مختلف در هر مقطع زمانی خاص است و بعد دیگر آن مربوط به زمان می­باشد، یعنی روش داده ­های ترکیبی/تلفیقی، روشی برای تلفیق مشاهدات مقطعی در خلال چندین دوره زمانی است (گجراتی، ۱۹۹۵: ۶۴).
در این پژوهش با توجه به نوع داده ­ها و روش­های تجزیه و تحلیل موجود، از روش «داده ­های ترکیبی/تلفیقی» استفاده می­ شود. منظور از داده ­های ترکیبی/تلفیقی، مجموعه ­ای از داده­هاست که متشکل از تعداد زیادی از متغیرهای مقطعی (N) است که در طول یک دوره زمانی مشخص (T) مورد بررسی قرار می­گیرند. در این صورت تعداد مشاهدات N × T بوده که با بهره گرفتن از مدل­های مختلفی قابل تخمین است.
با بهره گرفتن از داده ­های ترکیبی/تلفیقی، می­توان به تخمین­های کارا دست یافت. شکل کلی مدل داده ­های ترکیبی که به اجزاء خطا[۶۸] معروف است، به صورت زیر می­باشد (دوقرتی[۶۹]، ­۲۰۰۴، ۴۱۰):
(۳-۱۳)
در رابطه فوق Y نشان­دهنده متغیر وابسته، X متغیرهای توضیحی مشاهده شده و Z نشان­دهنده متغیرهای توضیحی غیرقابل مشاهده اثرگذار بر متغیر وابسته برای هر مقطع است که برای توضیح بهتر مدل داده ­های ترکیبی، این دسته از متغیرها از مقادیر اجزاء خطا جدا شده است. نماد i نشان­دهنده مقطع­ها یا واحدهای مشاهده شده، t نشان­دهنده دوره زمانی و j و p به ترتیب نشان­گر تعداد متغیرهای مشاهده شده و مشاهده نشده است. نشان دهنده خطای برآورد داده ­های ترکیبی است که تمامی شرایط مربوط به جملات خطا تحت فروض گوس- مارکف[۷۰] را داراست. جمله روند ( ) نشان­دهنده تغییرات جمله ثابت در طول زمان است. این مدل به «مدل داده ­های ترکیبی دوطرفه[۷۱]» معروف است (دوقرتی، ۲۰۰۴، ۴۱۱).
از آن جا که متغیرهای Z قابل اندازه ­گیری نیستند، می­توان مجموع همه آن­ها را به صورت یک متغیر نشان داد. در این صورت، معادله بالا را می­توان به صورت زیر بازنویسی کرد:
(۳-۱۴)

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...