گروه اپیدمیولوژی بالینی Saskia Le Cessie ، مرکز پزشکی دانشگاه لیدن ، لیدن ، گروه علوم داده های زیست پزشکی هلند ، مرکز پزشکی دانشگاه لیدن ، لیدن ، هلند
جستجوی مقالات دیگر توسط Saskia Le Cessie در سایت فعلی Google Scholar Close
Rolf H H Groenwold
Rolf H H Groenwold گروه اپیدمیولوژی بالینی ، مرکز پزشکی دانشگاه لیدن ، لیدن ، گروه علوم داده های زیست پزشکی هلند ، مرکز پزشکی دانشگاه لیدن ، لیدن ، هلند
جستجوی مقالات دیگر توسط Rolf H H Groenwold در سایت فعلی Google Scholar Close
Olaf M Dekkers
Olaf M Dekkers گروه اپیدمیولوژی بالینی ، مرکز پزشکی دانشگاه لیدن ، لیدن ، گروه غدد درون ریز هلند ، مرکز پزشکی دانشگاه لیدن ، لیدن ، هلند
جستجوی مقالات دیگر Olaf M Dekkers در سایت فعلی Google Scholar Close
مشاهده بیشتر مشاهده کمتر مکاتبات باید به S Le Cessie خطاب شود. ایمیل: s. le_cessie@lumc. nl doi: https://doi. org/10. 1530/eje-21-0251 جلد/شماره: دوره 184: شماره 6 صفحه صفحه: E15-E18
نوع مقاله: سرمقاله آنلاین انتشار تاریخ: 10 مه 2021 کپی رایت: © 2021 انجمن اروپایی غدد درون ریز 2021
دسترسی رایگان به روزرسانی ها را بررسی کنید
روش های مختلفی برای تعیین کمیت رابطه بین دو یا چند متغیر مداوم وجود دارد. برخی از محققان از ضرایب همبستگی استفاده می کنند. برخی دیگر روشهای رگرسیون مانند رگرسیون خطی را اعمال می کنند. در این مقاله ، ما نشان می دهیم که انتخاب بین همبستگی و رگرسیون صرفاً آماری نیست بلکه تا حد زیادی به اهداف تحقیق بستگی دارد. نکته مهم این است که همیشه باید قبل از استفاده از هر یک از دو روش ، داده ها را بازرسی کرد.
خلاصه
روش های مختلفی برای تعیین کمیت رابطه بین دو یا چند متغیر مداوم وجود دارد. برخی از محققان از ضرایب همبستگی استفاده می کنند. برخی دیگر روشهای رگرسیون مانند رگرسیون خطی را اعمال می کنند. در این مقاله ، ما نشان می دهیم که انتخاب بین همبستگی و رگرسیون صرفاً آماری نیست بلکه تا حد زیادی به اهداف تحقیق بستگی دارد. نکته مهم این است که همیشه باید قبل از استفاده از هر یک از دو روش ، داده ها را بازرسی کرد.
فرض کنید محققان سطح قند خون و سطح کورتیزول را در چندین فرد اندازه گیری می کنند و هدف آن تعیین کمیت رابطه بین این دو متغیر است. این می تواند با محاسبه ضریب همبستگی یا با استفاده از ضریب رگرسیون به دست آمده از یک آنالیز رگرسیون خطی ساده انجام شود. اما از کدام روش استفاده می شود؟از دیدگاه کاملاً آماری ، مهم نیست. اگر ضریب همبستگی را بدانیم (مگر اینکه در غیر این صورت بیان شود ، ما به ضریب همبستگی پیرسون اشاره می کنیم) ، محاسبه ضریب رگرسیون خطی مربوطه و برعکس بسیار آسان است. علاوه بر این ، هر دو روش هنگام آزمایش رابطه بین دو اقدامات هورمون دقیقاً همان P-Value را به دست می آورند. انتخاب بین همبستگی و رگرسیون به خصوصیات آماری داده ها بستگی ندارد. درعوض ، این زمینه تحقیق است: سوال تحقیق ، هدف از مطالعه و اینکه آیا کسی می خواهد نتایج بین مطالعات مختلف را مقایسه کند.
همبستگی
بیایید ابتدا به ضریب همبستگی نگاه کنیم. این ضریب میزان رابطه بین دو متغیر را خطی می کند. ضریب مقادیر بین 1 و 1 را می گیرد. این مثبت است که مقادیر بالاتر ، به عنوان مثال ، گلوکز با مقادیر بالاتر کورتیزول ، منفی می شود ، منفی وقتی مقادیر بالاتر گلوکز با مقادیر کمتری از کورتیزول اتفاق می افتد و طول می کشدمقدار 0 در غیاب رابطه خطی. مقادیر 1 یا −1 نشان دهنده یک رابطه خطی کامل است. همه مشاهدات در یک خط مستقیم قرار دارد. شکل 1 نمونه هایی از جمله ضریب همبستگی را نشان می دهد.

مشاهده اندازه کامل

شکل 1
چهار نمونه از رابطه بین دو متغیر و ضریب همبستگی مربوطه.
استناد: مجله اروپایی غدد درون ریز 184 ، 6 ؛10. 1530/EJE-21-0251
ضریب همبستگی اندازه گیری ارتباط است که در آن دو متغیر نقش یکسان را بازی می کنند و می توانند با هم تعویض شوند. همبستگی بین گلوکز و کورتیزول همان ارتباط بین کورتیزول و گلوکز است. در یک مطالعه ، می توان از آن برای کشف اینکه کدام متغیرها به شدت در ارتباط هستند ، استفاده شود ، با ضرایب همبستگی نزدیک به 1 یا −1 که به قوی ترین رابطه خطی اشاره دارد. با این حال ، بعداً خواهیم دید که در مقایسه با مقایسه نتایج در مطالعات مختلف ، این همبستگی کمتر مفید است.
پسرفت
گزینه دیگر برای ارزیابی رابطه بین دو متغیر مداوم ، رگرسیون خطی است. به عنوان مثال ، ما ممکن است بررسی کنیم که چگونه سطح گلوکز به عنوان تابعی از کورتیزول تغییر می کند و مدل خطی را در نظر می گیرد: میانگین گلوکز = α + β × کورتیزول. توجه داشته باشید که ، در این رویکرد آماری ، گلوکز و کورتیزول در اینجا نقش های مختلفی دارند ، گلوکز متغیر نتیجه ای است که می خواهیم توضیح دهیم ، همچنین متغیر وابسته نامیده می شود ، زیرا میانگین آن به مقدار کورتیزول بستگی دارد ، که متغیر مستقل نامیده می شود. ضریب رگرسیون β نشان دهنده میانگین تغییر گلوکز در واحد افزایش در کورتیزول است. این شیب خط رگرسیون است. ضریب رگرسیون β وابسته به واحد است. اگر کورتیزول را در μG/dl یا μMol/L اندازه گیری کنیم ، مقدار شیب خط رگرسیون متفاوت خواهد بود (شکل 2). توجه داشته باشید ، ضریب همبستگی و مقادیر p نسبت به چنین تغییراتی در واحدها بی حس هستند. در رگرسیون ، دو متغیر قابل تعویض نیستند. اگر متغیرهای وابسته و مستقل را تغییر دهیم و تجزیه و تحلیل رگرسیون را با کورتیزول به عنوان متغیر وابسته و گلوکز به عنوان متغیر مستقل انجام دهیم ، یک ضریب رگرسیون متفاوت و یک خط رگرسیون متفاوت به دست می آوریم. با این حال ، این که در اینجا سؤال تحقیق همراه است این است که چگونه گلوکز بر سطح کورتیزول تأثیر می گذارد. این نشان می دهد که دانش محتوا باید مدل آماری را راهنمایی کند ، نه برعکس. رگرسیون خطی را می توان گسترش داد تا در یک مدل چند متغیره برای مخدوش تنظیم شود (1).

مشاهده اندازه کامل

شکل 2
تأثیر انتخاب واحدها در شیب خط رگرسیون. در پانل بالا ، کورتیزول در میکرومول/dl و در پانل پایین ، در میکروگرم در لیتر اندازه گیری می شود. خط متراکم خط رگرسیون تخمین زده شده است ، معادله مربوطه در طرح آورده شده است. ضریب همبستگی (R) و P-Values (P) نسبت به چنین تغییراتی در واحدها حساس نیست.
استناد: مجله اروپایی غدد درون ریز 184 ، 6 ؛10. 1530/EJE-21-0251
رگرسیون در مقابل همبستگی
فرقی نمی کند که آیا آزمایش آماری برای ارتباط بین دو متغیر با آزمایش انجام می شود اگر ضریب همبستگی از صفر متفاوت باشد یا اینکه شیب خط رگرسیون از صفر متفاوت است. هر دو رویکرد دقیقاً همان آمار آزمون و p-Value را ارائه می دهند. ما قبلاً یک تفاوت مهم بین همبستگی و رگرسیون را مورد بحث قرار داده ایم ، این واقعیت که در همبستگی هر دو متغیر نقش یکسان را بازی می کنند ، در حالی که در رگرسیون ، میانگین یک متغیر به عنوان تابعی از دیگری مدل می شود. اما موضوعات بیشتری برای در نظر گرفتن وجود دارد:
I. یک همبستگی به دامنه متغیرها بستگی دارد ، که مقایسه های مربوط به مطالعات را محدود می کند.
این در شکل 3 نشان داده شده است. نتایج حاصل از یک مطالعه فرضی با 60 نفر است که رابطه بین سن و BMI مورد بررسی قرار می گیرد. در این مطالعه ، سن بین 20 تا 80 سال متفاوت است و ضریب همبستگی بین سن و BMI 0. 60 است. در طرح دوم ، نتایج نشان داده می شود که فقط زیر گروه افراد بین 40 تا 60 سال در نظر گرفته شود. همبستگی اکنون به دلیل کاهش تغییر سن بسیار کوچکتر است (R = 0. 26). در مقابل ، خط رگرسیون یکسان است (اگرچه ضرایب تخمین زده شده به دلیل تغییر تصادفی ممکن است کمی متفاوت باشد). این پدیده مقایسه ضرایب همبستگی را در مطالعات محدود می کند. اگر یک مطالعه همبستگی 0. 7 را پیدا کند ، در حالی که یک مطالعه دیگر همبستگی 0. 2 را برای همان دو متغیر پیدا می کند ، این لزوماً دلالت بر این ندارد که رابطه بین متغیرها بین مطالعات متفاوت است ، اما همچنین می تواند به دلیل محدودتر جمعیت در این جمعیت باشد. مطالعه دوماین بدان معنی است که ترکیب ضرایب همبستگی در یک متاآنالیز باید با احتیاط انجام شود.

مشاهده اندازه کامل

شکل 3
تأثیر محدودیت سنی بر همبستگی بین سن و BMI در یک مطالعه فرضی از این رابطه. اول ، رابطه بین سن و BMI در کل جمعیت با دامنه سن 20-80 سال. در مرحله بعد ، زیر گروه افراد بین 40 تا 60. در زیر گروه ضریب همبستگی بسیار کوچکتر است.
استناد: مجله اروپایی غدد درون ریز 184 ، 6 ؛10. 1530/EJE-21-0251
ii. از Outliers آگاه باشید. آنها ممکن است تا حد زیادی بر همبستگی و مدل های رگرسیون تأثیر بگذارند.
هر دو روش رگرسیون و همبستگی را می توان به شدت تحت تاثیر مشاهدات شدید قرار داد. شکل 4 نمونه ای را نشان می دهد که در آن رابطه بین کورتیزول و انسولین مورد مطالعه قرار گرفته است. در گوشه سمت راست بالا، یک مشاهده بسیار شدید با مقدار انسولین حدود 200 (mE/L) وجود دارد. هر دو تجزیه و تحلیل رگرسیون و همبستگی نشان دهنده یک ارتباط مثبت هستند، ضریب همبستگی برابر با 0. 50 است (95٪ CI: 0. 22؛ 0. 70، P = 0. 001). با این حال، اگر این نکته بسیار تاثیرگذار را حذف کنیم، همه چیز تغییر می کند. همبستگی ب ه-0. 15 کاهش می یابد (95٪ CI: -0. 44؛ 0. 18، P = 0. 37) و خط رگرسیون اکنون دارای شیب منفی است. این مثال نشان می دهد که ما همیشه باید داده های خود را قبل از انجام تحلیل های آماری به دقت بررسی کنیم (2). توجه داشته باشید که زمانی که متغیرها به طور معمول توزیع نشده باشند، مقادیر پرت تأثیرگذار بیشتر اتفاق می افتد و ممکن است در برخی موقعیت ها تبدیل لگاریتمی توصیه شود (برای جزئیات بیشتر به (3) مراجعه کنید. فقط اگر یک مقدار از نظر بیولوژیکی غیرممکن باشد، باید از تجزیه و تحلیل حذف شود.

مشاهده اندازه کامل

شکل 4
تأثیر یک مشاهده تأثیرگذار بر مطالعه رابطه بین کورتیزول و انسولین. خط چین خط رگرسیون تخمینی است زمانی که نقطه تأثیرگذار در گوشه سمت راست بالا گنجانده شود (همبستگی r = 0. 50)، خط ثابت خط رگرسیون به دست آمده پس از حذف نقطه تأثیرگذار است (r = -0. 15).
استناد: مجله اروپایی غدد درون ریز 184 ، 6 ؛10. 1530/EJE-21-0251
III. همبستگی و رگرسیون خطی یک رابطه خطی بین متغیرها را فرض می کند.
شکل 5 را در نظر بگیرید که در آن داده های فرضی در مورد BMI و سطوح کورتیزول نشان داده شده است، با انگیزه یک مطالعه واقعی (4). یک رابطه واضح بین BMI و کورتیزول وجود دارد، اما این رابطه خطی نیست و بهتر است به شکل U توصیف شود. ضریب همبستگی در این مثال نزدیک به صفر است (r = -0. 01) و خط رگرسیون بسیار صاف است. نکته این است که اگر از برنامه آماری رگرسیون خطی بخواهیم، این کار را انجام می دهد، حتی اگر داده ها به وضوح الگوی خطی را نشان ندهند. هنگامی که داده های خام، به عنوان مثال، در یک نمودار پراکنده بررسی نمی شوند، می توان چنین الگوهایی را از دست داد. در مثال شکل 5، یک مدل آماری که U شکل را مجاز می کند مناسب تر است (مثلاً با افزودن یک عبارت درجه دوم به مدل یا استفاده از گزینه های مدل سازی غیرخطی پیشرفته تر).

مشاهده اندازه کامل

شکل 5
مثالی از رابطه غیر خطی بین BMI و کورتیزول. خط چین خط رگرسیون خطی برآورد شده است.
استناد: مجله اروپایی غدد درون ریز 184 ، 6 ؛10. 1530/EJE-21-0251
نتیجه
انتخاب بین همبستگی و رگرسیون باید به این بستگی داشته باشد که آیا کسی به رابطه بین دو متغیر علاقه مند است (که در صورت همبستگی نقش یکسانی دارند) یا اینکه علاقه تأثیر یک (یا بیشتر) متغیر (ها) بر دیگری است (وابسته) متغیر. علاوه بر این ، همبستگی ها برای مقایسه در بین مطالعات مشکل ساز هستند ، زیرا به گسترش متغیرها بستگی دارد. از آنجا که هر دو مدل رگرسیون خطی استاندارد و همبستگی ها رابطه خطی بین متغیرها را فرض می کنند ، و هر دو می توانند به شدت تحت تأثیر خارج از کشور قرار بگیرند ، ما توصیه می کنیم قبل از استفاده از هر یک از این روش ها ، با ساخت پراکندگی ها همیشه یک بازرسی بصری از داده ها انجام دهیم.
اعلام علاقه
Olaf M Dekkers معاون سردبیر مجله اروپایی غدد درون ریز است. وی برای این مقاله در این مقاله یا سرمقاله درگیر نبود ، که در آن به عنوان نویسنده ذکر شده است. نویسندگان دیگر چیزی برای افشای آن ندارند.
منابع مالی
این تحقیق هیچ گونه کمک هزینه خاصی از هیچ آژانس بودجه در بخش عمومی ، تجاری یا غیر انتفاعی دریافت نکرده است.
منابع
Groenwold Rhh Dekkers OM
روش شناسی برای غدد درون ریز: جنبه های اساسی تنظیم مخدوش. مجله اروپایی غدد درون ریز 2020 182 E5 - E7.(https://doi. org/10. 1530/eje-20-0075)) |دروغ
Huebner M Le Cessie S Schmidt C Vach W
یک چارچوب مفهومی معاصر برای تجزیه و تحلیل داده های اولیه. مطالعات مشاهده ای 2018 4 171 - 1 92.) |دروغ
اخبار رمز ارزها...
ما را در سایت اخبار رمز ارزها دنبال می کنید
برچسب : نویسنده : علیمحمد افغانی بازدید : 26 تاريخ : پنجشنبه 19 مرداد 1402 ساعت: 13:41