برنامه نویسی

رگرسیون خطی – جامعه dev

در دنیای فعلی داده ها ، یافتن و درک ارتباط عمیق برای تصمیم گیری های عاقلانه بسیار مهم است. رگرسیون خطی به عنوان یک تکنیک اساسی اما بسیار قدرتمند ظاهر شد که به ما کمک می کند تا این کار را انجام دهیم. این نه تنها یک مفهوم آماری خالص بلکه یک آجر اول ضروری در زمینه یادگیری ماشین است.

اگر سفری را برای کشف اینکه چه کسی یا به سادگی می خواهید درک کنید چگونه می توان از داده ها برای پیش بینی استفاده کرد ، شروع کنید ، رگرسیون خطی یک نقطه شروع عالی است. همراه با فناوری AI VN برای کسب اطلاعات بیشتر در مورد این ابزار پلتفرم!

رگرسیون خطی چیست؟

رگرسیون خطی یک روش مدل سازی برای پیش بینی مقدار یک متغیر هدف (متغیر وابسته ، معمولاً نماد y) بر اساس مقدار یک یا چند متغیر ورودی است (متغیرهای مستقل ، با عنوان X).

تصور کنید که شما در حال تلاش برای یافتن ساده ترین قانون برای نشان دادن رابطه بین عناصری که دارید (متغیرهای مستقل) و نتیجه ای که می خواهید پیش بینی کنید (متغیرهای وابسته) را پیدا می کنید. رگرسیون خطی این کار را با پیدا کردن یک خط مستقیم (در مورد متغیر مستقل – رگرسیون تک) یا هواپیمای/هواپیمای فوق العاده صفحه (در مورد بسیاری از متغیرهای مستقل – رگرسیون) که مناسب داده های شما است ، انجام می دهد.

شرح تصویر
این مدل بر اساس فرمول فرم ریاضی است:

y≈ β
0


1

x
1


2

x
2

+⋯+b
حرف

x
حرف

در آنجا:

Y: به نوبه خود می خواهیم پیش بینی کنیم.
x
1

، x
2

،… ، x
حرف

: متغیرهای ورودی بر Y.
شرح
0

: ضریب رهگیری (رهگیری) ، مقدار تخمین زده شده از y است که تمام x برابر با 0 باشد.
شرح
1

، ب
2

، … ، ب
حرف

: ضرایب منظم (ضرایب) ، که نشان دهنده سطح و جهت تغییر y در هنگام متغیر x است
من

مطابق با تغییر واحد ، نگه داشتن متغیرهای دیگر.
هدف اصلی هنگام ساختن مدل رگرسیون خطی ، یافتن مجموعه ای از مقادیر بهینه β است ، به طوری که خطای بین مقدار Y واقعی در داده ها و مقدار Y کوچکترین مدل پیش بینی شده است.

شرح تصویر
فرآیند ساخت مدل رگرسیون خطی

برای داشتن یک مدل رگرسیون خطی قابل اعتماد ، باید یک فرآیند سیستماتیک را دنبال کنیم:

تهیه داده ها:

این مرحله اساسی است. داده ها باید به طور کامل جمع آوری و مطابق با مشکل.
انجام تمیز کردن داده ها: رسیدگی به مقادیر گمشده (به عنوان مثال ، پر کردن متوسط ​​، متوسط ​​یا حذف) ، شناسایی و پردازش مسافت (Outersiers) می تواند مدل انحراف را بکشد.
تبدیل داده ها: متغیرهای مقیاس گذاری (مقیاس گذاری) در صورت لزوم ، متغیرهای طبقه بندی رمزگذاری شده (مانند جنسیت ، رنگ) به اعداد. داده های تمیز و خوب فرمت یک عامل تعیین کننده در کیفیت مدل است.
آموزش مدل:

مجموعه داده های آماده شده را به مجموعه های آموزشی و مجموعه های آزمایش تقسیم کنید. آموزش (معمولاً 70-80 ٪ از داده ها را برای یافتن ضریب β بهینه استفاده می کند.
برای استفاده از الگوریتم رگرسیون خطی در آموزش ، از کتابخانه های تخصصی در زبانهای برنامه نویسی مانند پایتون (به عنوان مثال Scikit-Learn) استفاده کنید. این فرآیند این است که رایانه به طور خودکار مقادیر β را برای کمک به دقیق ترین مدل پیش بینی بر اساس داده های ارائه شده پیدا می کند.
ارزیابی عملکرد:

پس از آموزش مدل ، ما از آزمون استفاده می کنیم (داده های مدل هرگز پیدا نشده است) برای ارزیابی مکان به خوبی روی داده های جدید.
شاخص های مشترک شامل موارد زیر است:
r-squared (r
2
): نشان می دهد که چند درصد از مدل تغییرات متغیر وابسته را توضیح می دهد. مقدار r
2
هرچه به 1 نزدیکتر باشد ، مدل بهتر است داده ها را توضیح می دهد.
میانگین خطای مربع (MSE) / میانگین خطای مربع (RMSE): میانگین مربع / مربع خطای خطاها بین مقدار قابل پیش بینی و مقدار واقعی را اندازه گیری کنید. این مقدار تا حد امکان کوچکتر است. RMSE اغلب بیشتر مورد استفاده قرار می گیرد زیرا همان واحد با متغیر هدف ، تفسیر آسان است.
با مقایسه عملکرد در آموزش و آزمایش ، پدیده بیش از حد (داده های آموزش یادآوری) را بررسی کنید.

شرح تصویر
نقش رگرسیون خطی در AI و دستگاه یادگیری

رگرسیون خطی یکی از اساسی ترین الگوریتم ها و یک نقطه شروع ایده آل در زمینه یادگیری تحت نظارت است.

بزرگترین فایده رگرسیون خطی تفسیر است. بر خلاف بسیاری دیگر از مدل های یادگیری ماشین پیچیده مانند جعبه های سیاه ، با رگرسیون خطی ، می توانید مستقیماً به ضرایب β نگاه کنید تا بفهمید کدام متغیر ورودی مهم ، بر متغیر هدف که در آن جهت (افزایش یا کاهش) تأثیر می گذارد و میزان تأثیر آن تأثیر می گذارد. این امر در مناطقی که نیاز به شفافیت و توضیح واضح در مورد نتایج دارند (مانند تجارت ، سلامت ، امور مالی) بسیار مفید است.

علاوه بر این ، درک رگرسیون خطی یک پایه محکم برای جذب مفاهیم پیشرفته تر در یادگیری ماشین مانند عملکرد از دست دادن (عملکرد از دست دادن) ، روش های بهینه سازی (مانند تبار شیب) یا مدلهای پیچیده تر مانند رگرسیون لجستیک (برای مشکلات طبقه بندی) ، مدلهای عمومی (مدلهای خطی عمومی) یا حتی ساختار اساسی شبکه مصنوعی است.

شرح تصویر
رگرسیون خطی ابزاری ساده ، آسان برای درک اما بسیار قدرتمند در زرادخانه هر تحلیلگر یا مهندس داده است. توانایی مدل سازی روابط خطی ، شفافیت و نقش اساسی در یادگیری ماشین ، این تکنیک را از دست نمی دهد.

تسلط بر رگرسیون خطی نه تنها به شما کمک می کند تا بسیاری از مشکلات پیش بینی عملی را حل کنید بلکه در را نیز باز کنید تا در دنیای گسترده هوش مصنوعی و علم داده به دانش عمیق دسترسی پیدا کنید.

برای به روزرسانی مقالات و دانش مفیدتر در مورد هوش مصنوعی ، یادگیری ماشین و سایر فن آوری های پیشرفته ، به نظارت بر فناوری هوش مصنوعی ویتنامی ادامه دهید!

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا