برنامه نویسی

راهنمای مبتدیان برای Scikit-Learn (sklearn) 📚

ek3nk4r 2024-08-02

0 17 خواندن این مطلب 10 دقیقه زمان میبرد

راهنمای مبتدیان برای Scikit-Learn (sklearn) 📚

پیشنهاد ویژه

خرید فالوور واقعی خرید لایک اینستاگرام خرید ویو اینستاگرام خرید فالوور اینستاگرام

Summarize this content to 400 words in Persian Lang

Scikit-Learn چیست؟ 🤔

Scikit-Learn یک کتابخانه محبوب پایتون است که ابزارهای ساده و کارآمدی را برای داده کاوی، تجزیه و تحلیل داده ها و یادگیری ماشین فراهم می کند. این بر روی کتابخانه های دیگر مانند NumPy، SciPy و Matplotlib ساخته شده است، و آن را به گزینه ای عالی برای ساخت مدل های ساده و پیچیده تبدیل می کند.

ویژگی های کلیدی Scikit-Learn 🌟

رابط ساده و سازگار: همه مدل های یادگیری ماشین در sklearn از یک رابط اصلی پیروی می کنند. وقتی یکی را یاد گرفتید، می توانید از همه آنها استفاده کنید!

طیف گسترده ای از الگوریتم ها: شامل الگوریتم هایی برای طبقه بندی، رگرسیون، خوشه بندی و غیره است.

ابزارهای پیش پردازش: داده های خود را به راحتی با ابزارهایی برای مقیاس بندی، عادی سازی و رمزگذاری تمیز و آماده کنید.

ارزیابی مدل: معیارها و ابزارهای متعدد برای اعتبارسنجی مدل های شما.

نصب Scikit-Learn 📥

قبل از شروع، بیایید مطمئن شویم که Scikit-Learn را نصب کرده اید. اگر هنوز آن را نصب نکرده اید، می توانید به راحتی با استفاده از pip آن را دریافت کنید:

pip install scikit-learn

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

حالا بیایید با چند مثال اساسی شروع کنیم! 🎉

مثال 1: بارگیری و درک داده ها 🗂️

اول از همه، اجازه دهید مقداری داده را بارگذاری کنیم! Scikit-Learn با مجموعه‌ای از مجموعه داده‌های داخلی ارائه می‌شود. ما از معروف استفاده خواهیم کرد مجموعه داده عنبیه برای مثال ما

from sklearn.datasets import load_iris

# Load the Iris dataset
iris = load_iris()

# Check out the features and labels
print(“Features:”, iris.feature_names)
print(“Labels:”, iris.target_names)

# Display the first 5 records
print(“First 5 records:\n”, iris.data[:5])

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Features: [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’] Labels: [‘setosa’ ‘versicolor’ ‘virginica’] First 5 records:
[[5.1 3.5 1.4 0.2] [4.9 3.0 1.4 0.2] [4.7 3.2 1.3 0.2] [4.6 3.1 1.5 0.2] [5.0 3.6 1.4 0.2]]

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

مثال 2: تقسیم داده ها 🎲

قبل از آموزش یک مدل، مهم است که داده های خود را به مجموعه های آموزشی و آزمایشی تقسیم کنید. این به شما کمک می کند عملکرد مدل خود را بر روی داده های دیده نشده ارزیابی کنید.

from sklearn.model_selection import train_test_split

# Split the data (80% training, 20% testing)
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

print(“Training set size:”, len(X_train))
print(“Testing set size:”, len(X_test))

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Training set size: 120
Testing set size: 30

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

مثال 3: ساختن یک طبقه بندی کننده ساده 🧠

بیایید یک مدل طبقه بندی ساده با استفاده از k-نزدیکترین همسایگان (k-NN) الگوریتم این یک الگوریتم عالی برای مبتدیان است!

from sklearn.neighbors import KNeighborsClassifier

# Initialize the model
knn = KNeighborsClassifier(n_neighbors=3)

# Train the model
knn.fit(X_train, y_train)

# Make predictions on the test set
predictions = knn.predict(X_test)

# Display predictions
print(“Predictions:”, predictions)
print(“Actual Labels:”, y_test)

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Predictions: [0 1 2 1 1 0 2 1 1 2 2 1 0 0 2 1 1 1 2 0 0 0 2 2 0 1 2 0 0 1] Actual Labels: [0 1 2 1 1 0 2 1 1 2 2 1 0 0 2 1 1 1 2 0 0 0 2 2 0 1 2 0 0 1]

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

مثال 4: ارزیابی مدل 📊

حال، بیایید عملکرد مدل خود را با استفاده از دقت، یکی از ساده ترین معیارها، ارزیابی کنیم.

from sklearn.metrics import accuracy_score

# Calculate the accuracy
accuracy = accuracy_score(y_test, predictions)
print(“Model Accuracy:”, accuracy)

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Model Accuracy: 1.0

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

یادگیری ماشین با Scikit-Learn 🌟

بیایید چند تکنیک یادگیری ماشین بیشتری را با استفاده از Scikit-Learn بررسی کنیم. ما به نمونه هایی از پسرفت، خوشه بندی، و کاهش ابعاد. اینها مفاهیم کلیدی در یادگیری ماشین هستند و Scikit-Learn اجرای آنها را بسیار آسان می کند. بیایید شیرجه بزنیم! 🏊‍♂️

مثال 1: رگرسیون خطی 📈

رگرسیون خطی یک مقدار پیوسته مانند قیمت خانه یا دما را پیش بینی می کند. این یکی از ساده ترین و پرکاربردترین تکنیک های رگرسیون است.

بیان مسأله:

بیایید رابطه بین یک فرد را پیش بینی کنیم BMI و آنها وزن.

from sklearn.linear_model import LinearRegression
import numpy as np

# Sample data: BMI and corresponding weights
X = np.array([[18.5], [24.9], [30.0], [35.0], [40.0]]) # BMI
y = np.array([60, 70, 80, 90, 100]) # Weight in kg

# Initialize and train the model
model = LinearRegression()
model.fit(X, y)

# Predict weight for a BMI of 28.0
predicted_weight = model.predict([[28.0]])
print(“Predicted weight for BMI 28.0:”, predicted_weight[0], “kg”)

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Predicted weight for BMI 28.0: 76.923 kg

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

مثال 2: K-Means Clustering 🎨

K-Means Clustering یک الگوریتم یادگیری بدون نظارت است که برای گروه بندی نقاط داده مشابه در خوشه ها استفاده می شود. زمانی که می خواهید الگوها یا گروه بندی ها را در داده های خود شناسایی کنید مفید است.

بیان مسأله:

مشتریان را بر اساس عادات خرج کردنشان گروه بندی کنید.

from sklearn.cluster import KMeans

# Sample data: Annual Income and Spending Score
X = np.array([[15, 39], [16, 81], [17, 6], [18, 77], [19, 40], [20, 76]])

# Initialize the model with 2 clusters
kmeans = KMeans(n_clusters=2, random_state=42)
kmeans.fit(X)

# Predict the cluster for a new customer with income 18 and spending score 50
cluster = kmeans.predict([[18, 50]])
print(“Cluster for new customer:”, cluster[0])

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Cluster for new customer: 1

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

مثال 3: تجزیه و تحلیل اجزای اصلی (PCA) 🌐

تجزیه و تحلیل اجزای اصلی (PCA) یک تکنیک کاهش ابعاد است. اغلب برای کاهش تعداد ویژگی های یک مجموعه داده استفاده می شود و در عین حال بیشتر واریانس (اطلاعات) را حفظ می کند.

بیان مسأله:

ابعاد مجموعه داده Iris را به 2 جزء کاهش دهید.

from sklearn.decomposition import PCA
from sklearn.datasets import load_iris

# Load the Iris dataset
iris = load_iris()
X = iris.data

# Initialize PCA with 2 components
pca = PCA(n_components=2)
X_reduced = pca.fit_transform(X)

# Print the reduced feature set
print(“Reduced feature set:\n”, X_reduced[:5])

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

خروجی:

Reduced feature set:
[[-2.68412563 0.31939725] [-2.71414169 -0.17700123] [-2.88899057 -0.14494943] [-2.74534286 -0.31829898] [-2.72871654 0.32675451]]

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

نتیجه گیری 🎉

تبریک میگم شما به تازگی اولین مدل یادگیری ماشینی خود را با استفاده از Scikit-Learn ساخته و ارزیابی کرده اید. 💪 همانطور که می بینید، Scikit-Learn به لطف رابط کاربری ساده و سازگار، شروع به یادگیری ماشین را آسان می کند.

این نمونه ها فقط نوک کوه یخ هستند! هر چه بیشتر تمرین کنید، نتیجه بهتری خواهید گرفت. یادگیری ماشینی حوزه وسیعی است، اما با ابزارهایی مانند Scikit-Learn، می‌توانید آن را یک مرحله در یک زمان کاوش کنید. به کاوش ادامه دهید، مجموعه داده‌ها و الگوریتم‌های مختلف را امتحان کنید، و مهمتر از همه، لذت ببرید! یادگیری ماشین یک زمینه وسیع و هیجان انگیز است و Scikit-Learn ابزاری فوق العاده برای کمک به شما است.

کد نویسی مبارک! 😄

توجه داشته باشید: اگر برای یادگیری بیشتر هیجان زده هستید، در آزمایش با الگوریتم های دیگر در sklearn تردید نکنید. احتمالات بی پایان هستند! 🚀

درمورد من:🖇️لینکدین🧑‍💻گیت هاب

فهرست مطالب

Scikit-Learn چیست؟ 🤔

ویژگی های کلیدی Scikit-Learn 🌟

رابط ساده و سازگار: همه مدل های یادگیری ماشین در sklearn از یک رابط اصلی پیروی می کنند. وقتی یکی را یاد گرفتید، می توانید از همه آنها استفاده کنید!
طیف گسترده ای از الگوریتم ها: شامل الگوریتم هایی برای طبقه بندی، رگرسیون، خوشه بندی و غیره است.
ابزارهای پیش پردازش: داده های خود را به راحتی با ابزارهایی برای مقیاس بندی، عادی سازی و رمزگذاری تمیز و آماده کنید.
ارزیابی مدل: معیارها و ابزارهای متعدد برای اعتبارسنجی مدل های شما.

نصب Scikit-Learn 📥

pip install scikit-learn

حالا بیایید با چند مثال اساسی شروع کنیم! 🎉

مثال 1: بارگیری و درک داده ها 🗂️

اول از همه، اجازه دهید مقداری داده را بارگذاری کنیم! Scikit-Learn با مجموعه‌ای از مجموعه داده‌های داخلی ارائه می‌شود. ما از معروف استفاده خواهیم کرد مجموعه داده عنبیه برای مثال ما

from sklearn.datasets import load_iris

# Load the Iris dataset
iris = load_iris()

# Check out the features and labels
print("Features:", iris.feature_names)
print("Labels:", iris.target_names)

# Display the first 5 records
print("First 5 records:\n", iris.data[:5])

خروجی:

Features: ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
Labels: ['setosa' 'versicolor' 'virginica']
First 5 records:
 [[5.1 3.5 1.4 0.2]
 [4.9 3.0 1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.0 3.6 1.4 0.2]]

مثال 2: تقسیم داده ها 🎲

from sklearn.model_selection import train_test_split

# Split the data (80% training, 20% testing)
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

print("Training set size:", len(X_train))
print("Testing set size:", len(X_test))

خروجی:

Training set size: 120
Testing set size: 30

مثال 3: ساختن یک طبقه بندی کننده ساده 🧠

بیایید یک مدل طبقه بندی ساده با استفاده از k-نزدیکترین همسایگان (k-NN) الگوریتم این یک الگوریتم عالی برای مبتدیان است!

from sklearn.neighbors import KNeighborsClassifier

# Initialize the model
knn = KNeighborsClassifier(n_neighbors=3)

# Train the model
knn.fit(X_train, y_train)

# Make predictions on the test set
predictions = knn.predict(X_test)

# Display predictions
print("Predictions:", predictions)
print("Actual Labels:", y_test)

خروجی:

Predictions: [0 1 2 1 1 0 2 1 1 2 2 1 0 0 2 1 1 1 2 0 0 0 2 2 0 1 2 0 0 1]
Actual Labels: [0 1 2 1 1 0 2 1 1 2 2 1 0 0 2 1 1 1 2 0 0 0 2 2 0 1 2 0 0 1]

مثال 4: ارزیابی مدل 📊

حال، بیایید عملکرد مدل خود را با استفاده از دقت، یکی از ساده ترین معیارها، ارزیابی کنیم.

from sklearn.metrics import accuracy_score

# Calculate the accuracy
accuracy = accuracy_score(y_test, predictions)
print("Model Accuracy:", accuracy)

خروجی:

Model Accuracy: 1.0

یادگیری ماشین با Scikit-Learn 🌟

بیایید چند تکنیک یادگیری ماشین بیشتری را با استفاده از Scikit-Learn بررسی کنیم. ما به نمونه هایی از پسرفت، خوشه بندی، و کاهش ابعاد. اینها مفاهیم کلیدی در یادگیری ماشین هستند و Scikit-Learn اجرای آنها را بسیار آسان می کند. بیایید شیرجه بزنیم! 🏊‍♂️

مثال 1: رگرسیون خطی 📈

رگرسیون خطی یک مقدار پیوسته مانند قیمت خانه یا دما را پیش بینی می کند. این یکی از ساده ترین و پرکاربردترین تکنیک های رگرسیون است.

بیان مسأله:

بیایید رابطه بین یک فرد را پیش بینی کنیم BMI و آنها وزن.

from sklearn.linear_model import LinearRegression
import numpy as np

# Sample data: BMI and corresponding weights
X = np.array([[18.5], [24.9], [30.0], [35.0], [40.0]])  # BMI
y = np.array([60, 70, 80, 90, 100])  # Weight in kg

# Initialize and train the model
model = LinearRegression()
model.fit(X, y)

# Predict weight for a BMI of 28.0
predicted_weight = model.predict([[28.0]])
print("Predicted weight for BMI 28.0:", predicted_weight[0], "kg")

خروجی:

Predicted weight for BMI 28.0: 76.923 kg

مثال 2: K-Means Clustering 🎨

K-Means Clustering یک الگوریتم یادگیری بدون نظارت است که برای گروه بندی نقاط داده مشابه در خوشه ها استفاده می شود. زمانی که می خواهید الگوها یا گروه بندی ها را در داده های خود شناسایی کنید مفید است.

بیان مسأله:

مشتریان را بر اساس عادات خرج کردنشان گروه بندی کنید.

from sklearn.cluster import KMeans

# Sample data: Annual Income and Spending Score
X = np.array([[15, 39], [16, 81], [17, 6], [18, 77], [19, 40], [20, 76]])

# Initialize the model with 2 clusters
kmeans = KMeans(n_clusters=2, random_state=42)
kmeans.fit(X)

# Predict the cluster for a new customer with income 18 and spending score 50
cluster = kmeans.predict([[18, 50]])
print("Cluster for new customer:", cluster[0])

خروجی:

Cluster for new customer: 1

مثال 3: تجزیه و تحلیل اجزای اصلی (PCA) 🌐

تجزیه و تحلیل اجزای اصلی (PCA) یک تکنیک کاهش ابعاد است. اغلب برای کاهش تعداد ویژگی های یک مجموعه داده استفاده می شود و در عین حال بیشتر واریانس (اطلاعات) را حفظ می کند.

بیان مسأله:

ابعاد مجموعه داده Iris را به 2 جزء کاهش دهید.

from sklearn.decomposition import PCA
from sklearn.datasets import load_iris

# Load the Iris dataset
iris = load_iris()
X = iris.data

# Initialize PCA with 2 components
pca = PCA(n_components=2)
X_reduced = pca.fit_transform(X)

# Print the reduced feature set
print("Reduced feature set:\n", X_reduced[:5])

خروجی:

Reduced feature set:
 [[-2.68412563  0.31939725]
 [-2.71414169 -0.17700123]
 [-2.88899057 -0.14494943]
 [-2.74534286 -0.31829898]
 [-2.72871654  0.32675451]]