برنامه نویسی

پروژه رایگان: از ChatGPT برای رسم با پایتون و Matplotlib استفاده کنید

Summarize this content to 400 words in Persian Lang

آیا می خواهید ترسیم در پایتون را یاد بگیرید؟ ChatGPT به شما کمک خواهد کرد.

این پروژه از ChatGPT می خواهد تا به شما یاد دهد که چگونه کد پایتون را برای ایجاد نمودارها و تجسم ها تولید کنید. به سادگی شرح مختصری از طرحی که می خواهید ایجاد کنید ارائه دهید و ChatGPT کد لازم را با استفاده از کتابخانه محبوب Matplotlib ایجاد می کند. این ابزار حتی به کاربرانی که تجربه برنامه نویسی ندارند نیز اجازه می دهد تا نمودارهای حرفه ای برای داده های خود ایجاد کنند. چه محقق، دانشمند داده یا دانش آموز باشید، ChatGPT ایجاد طرح های زیبا و آموزنده در پایتون را آسان می کند. (تولید شده توسط ChatGPT با تغییرات جزئی).

پروژه در JupyterNotebook در دسترس است رایگان در کلاس شناختی

1. بیایید در مورد حوزه خاص مورد علاقه خود که می خواهیم یاد بگیریم بپرسیم.

پرسیدن: “به من بیاموز چگونه در پایتون نقشه بکشم”نتیجه:راه های زیادی برای رسم داده ها در پایتون وجود دارد. در اینجا یک مثال ساده با استفاده از Matplotlib، یک کتابخانه تجسم داده محبوب در پایتون آورده شده است:

# using the provided by chatGPT to run in the notebook
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4] y = [1, 4, 9, 16] # Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.plot(x, y)
# Add a title
ax.set_title(‘My Plot’)
# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

این یک نمودار خطی ساده از داده ها در x و y ایجاد می کند. گزینه ها و گزینه های سفارشی سازی زیادی برای ایجاد نمودار در Matplotlib وجود دارد. به عنوان مثال، می توانید ظاهر خطوط را تغییر دهید، برچسب های محور را تغییر دهید، یک افسانه و غیره اضافه کنید.

در اینجا اطلاعات بیشتری در مورد Matplotlib و دیگر کتابخانه های رسم در پایتون آمده است:اسناد Matplotlib: https://matplotlib.org/stable/index.htmlآموزش Matplotlib: https://matplotlib.org/stable/tutorials/index.htmlSeaborn، یک کتابخانه تجسم داده بر اساس Matplotlib: https://seaborn.pydata.org/Plotly، کتابخانه ای برای ایجاد نمودارهای تعاملی: https://plotly.com/python/

همانطور که می بینید، ChatGPT بلوک های متن و کد مقدماتی (با نماد کپی برای راحتی) فراهم می کند و مکالمه را با اطلاعات مفید اضافی به پایان می رساند.

2. می توانید سوالات بعدی را بپرسید

با پرسیدن ساده “نمونه های بیشتری از نقشه ها در پایتون را به من نشان دهید”. در واقع chatGPT مکالمات قبلی شما را به خاطر می آورد.نتیجه:در اینجا چند نمونه دیگر از نمودارهایی وجود دارد که می توانید در پایتون با استفاده از کتابخانه Matplotlib ایجاد کنید: طرح پراکندگی

import matplotlib.pyplot as plt

# Sample data
x = [1, 2, 3, 4] y = [1, 4, 9, 16]

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data
ax.scatter(x, y)

# Add a title
ax.set_title(‘My Scatter Plot’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

طرح نوار

import matplotlib.pyplot as plt

# Sample data
x = [1, 2, 3, 4] y = [1, 4, 9, 16]

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data
ax.bar(x, y)

# Add a title
ax.set_title(‘My Bar Plot’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

نمودار دایره ای

import matplotlib.pyplot as plt

# Sample data
labels = [‘Apples’, ‘Bananas’, ‘Oranges’] sizes = [30, 45, 25]

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data
ax.pie(sizes, labels=labels)

# Add a title
ax.set_title(‘My Pie Chart’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

به خاطر داشته باشید که اینها تنها چند نمونه هستند و انواع دیگری از نمودارها وجود دارد که می توانید با استفاده از Matplotlib در پایتون ایجاد کنید. می توانید اطلاعات و نمونه های بیشتر را در مستندات Matplotlib بیابید: https://matplotlib.org/stable/index.html.

بیایید از یک مجموعه داده نمونه رسم کنیم

3. چند مجموعه داده نمونه را پیشنهاد دهید

مرحله اولیه که برای بارگیری داده ها نیاز دارید. می‌توانیم از ChatGPT بخواهیم که با پرسیدن چند مجموعه داده نمونه را پیشنهاد کند “آیا می توانید مجموعه داده های نمونه برای مبتدیان پایتون را به من بگویید؟”نتیجه:مطمئنا! در اینجا چند مجموعه داده وجود دارد که ممکن است برای مبتدیان در پایتون مفید باشد:

مجموعه داده زنبق: این مجموعه داده کوچکی است که حاوی اطلاعاتی در مورد گونه های مختلف گل زنبق، از جمله طول و عرض کاسبرگ و گلبرگ است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های یادگیری ماشین و تجزیه و تحلیل داده ها استفاده می شود. می توانید مجموعه داده Iris را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.

مجموعه داده مسکن بوستون: این مجموعه داده حاوی اطلاعاتی در مورد قیمت مسکن در منطقه بوستون، از جمله ارزش متوسط ​​خانه ها، نرخ جرم و جنایت و عوامل دیگر است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های رگرسیون استفاده می شود. شما می توانید مجموعه داده Boston Housing را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.

مجموعه داده MNIST: این مجموعه داده ای از ارقام دست نویس است که 60000 نمونه آموزشی و 10000 نمونه آزمایشی دارد. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های طبقه بندی تصاویر استفاده می شود. می توانید مجموعه داده MNIST را در پایتون با استفاده از ماژول keras.datasets بارگیری کنید.

از میان این مجموعه داده های پیشنهادی، مجموعه داده Iris را برای ادامه کار به عنوان نمونه انتخاب می کنیم.

3.1. مجموعه داده عنبیه را به عنوان نمونه بارگیری کنید تا هوشمندانه کار کنید

ساعت

ما به یک نمونه مناسب در قالب جدول نیاز داریم، بنابراین ما پرسیدیم “بارگیری داده های عنبیه با فرمت جدولی”نتیجه:برای بارگذاری مجموعه داده های Iris در قالب جدول مانند در پایتون، می توانید از کتابخانه Pandas استفاده کنید. در اینجا مثالی از نحوه بارگیری مجموعه داده های Iris و نمایش آن در قالب جدولی آورده شده است:

import pandas as pd
from sklearn import datasets

# Load the Iris dataset
iris = datasets.load_iris()

# Create a DataFrame with the features and target values
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df[‘target’] = iris.target

# Display the DataFrame
print(df)
#–> or we can call the dataset to displace it
df

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

_این یک Pandas DataFrame با ویژگی های (طول کاسبرگ، عرض کاسبرگ، طول گلبرگ و عرض گلبرگ) مجموعه داده عنبیه به عنوان ستون، و مقادیر هدف (نوع عنبیه) به عنوان یک ستون اضافی ایجاد می کند.

سپس می توانید از توابع معمول پانداها برای دستکاری و تجزیه و تحلیل داده ها در DataFrame استفاده کنید. برای مثال، می‌توانید از تابع head() برای نمایش چند ردیف اول DataFrame استفاده کنید، یا از تابع describe() برای دریافت آمار خلاصه برای ستون‌های عددی استفاده کنید._

4. مجموعه داده را رسم کنید

به راحتی می‌توانیم سؤالات بعدی را بپرسیم. اینجا پرسیدیم “طرح آن”نتیجه:برای رسم مجموعه داده Iris با استفاده از Matplotlib، می توانید از کد زیر استفاده کنید:

# –> Trying of the suggestions from ChatGPT
# –> we removed the redundant lines (e.g. loading libraries and importing data) from the suggestion

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data, coloring the points by the target values
scatter = ax.scatter(df[‘sepal length (cm)’], df[‘sepal width (cm)’], c=df[‘target’])

# Add a legend
legend = ax.legend(*scatter.legend_elements(), title=”Species”)

# Add a title
ax.set_title(‘Iris dataset’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

4.1. ستون مخصوص طرح

ما انتخاب می کنیم و می خواهیم یک ستون خاص را در مجموعه داده رسم کنیم. به عنوان مثال، پرسیدن “توزیع ستون “طول کاسبرگ (سانتی متر) را به من نشان دهید”نتیجه:

برای نشان دادن توزیع یک ستون در Pandas DataFrame، می توانید از تابع hist() DataFrame استفاده کنید. به عنوان مثال، برای نشان دادن توزیع ستون 'sepal length (cm)' در مجموعه داده Iris، می توانید از کد زیر استفاده کنید:

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the distribution of the ‘sepal length (cm)’ column
df[‘sepal length (cm)’].hist(ax=ax)

# Add a title
ax.set_title(‘Distribution of sepal length’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

همانطور که متوجه شدید، طرح فاقد برچسب است. بنابراین، می‌توانیم ** بپرسیم «آن را با برچسب‌های محور مناسب انجام دهید».نتیجه:**

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the distribution of the ‘sepal length (cm)’ column
df[‘sepal length (cm)’].hist(ax=ax)

# Add axis labels
ax.set_xlabel(‘Sepal length (cm)’)
ax.set_ylabel(‘Frequency’)

# Add a title
ax.set_title(‘Distribution of sepal length’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

4.2. طرح پیچیده تر

یکی دیگر از نمودارهای مفید برای نشان دادن توزیع، استفاده از نمودار جعبه است که ما را قادر می سازد انحراف استاندارد را تجسم کنیم و نقاط پرت را شناسایی کنیم.

در اینجا ما برای تمام ستون های نشان داده شده در نمودار واحد درخواست می کنیم از شما می‌پرسد: «نشان دهید نمودار باکسی از توزیع همه ستون‌ها در یک طرح».نتیجه:

برای نشان دادن توزیع تمام ستون‌ها در Pandas DataFrame به‌عنوان باکس‌پلات در یک نمودار، می‌توانید از تابع boxplot() DataFrame استفاده کنید.

به عنوان مثال، برای نشان دادن توزیع تمام ستون‌ها در مجموعه داده عنبیه به‌عنوان باکس پلات، می‌توانید از کد زیر استفاده کنید:

import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets

# Load the Iris dataset
iris = datasets.load_iris()

# Create a DataFrame with the features
df = pd.DataFrame(iris.data, columns=iris.feature_names)

# Add a column with the target values
df[‘target’] = iris.target

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the boxplots of all columns
df.boxplot(ax=ax)

# Add a title
ax.set_title(‘Distributions of all columns’)

# Show the plot
plt.show()

وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

5. استفاده از chatGPT برای پروژه خود

ChatGPT یک ابزار عالی برای کار بر روی پروژه شما است. مهم است که سؤال را به گونه ای طرح کنید که مشکل شما را برطرف کند. به خاطر داشته باشید که تقسیم پروژه خود به بلوک های کوچکتر و پرداختن به آنها به صورت جداگانه، کلید پرداختن به پروژه است.

برای پرسیدن یک سوال برنامه نویسی از ChatGPT، می توانید به سادگی یک توضیح واضح و مختصر از مشکل خود به همراه هر کد یا پیام خطا مربوطه ارائه دهید. همچنین باید زبان برنامه نویسی و کتابخانه ها یا فریم ورک هایی که استفاده می کنید را مشخص کنید.

5.1. نحوه درست فرموله کردن یک سوال (معروف به درخواست) برای ChatGPT

بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.

هنگام فرموله کردن یک درخواست برای ChatGPT، مهم است که چند نکته را در نظر داشته باشید تا بهترین استفاده را از مدل ببرید:در مورد کاری که می خواهید مدل انجام دهد، مشخص و واضح باشید. به عنوان مثال، به جای اینکه بپرسید «در مورد این موضوع چه می‌دانید؟»، بپرسید «آیا می‌توانید یک مرور مختصر از تاریخچه موضوع ارائه دهید؟»

در صورت لزوم زمینه را ارائه دهید. اگر در مورد یک رویداد یا شخص خاص سؤالی می‌پرسید، اطلاعات زمینه‌ای را ارائه دهید تا مدل بتواند زمینه‌ای را که در آن سؤال می‌پرسید، درک کند.

مختصر باشد. درک پیام‌های طولانی و پیچیده برای مدل دشوار است و ممکن است منجر به پاسخ‌های کمتر دقیق یا مرتبط شود.

از استفاده از زبان یا اصطلاحات بسیار فنی که ممکن است مدل با آن آشنا نباشد، خودداری کنید.

از پرسیدن چند سوال در یک درخواست خودداری کنید، بهتر است هر بار یک سوال بپرسید.

در اینجا چند نمونه از دستورات خوب برای ChatGPT آورده شده است:”آیا می توانید تفاوت اصلی بین یادگیری تحت نظارت و بدون نظارت را توضیح دهید؟”

اجزای اصلی یک شبکه عصبی چیست و چگونه کار می کنند؟

“لطفا یک داستان کوتاه در مورد رباتی بنویسید که می تواند ذهن ها را بخواند”

از سوی دیگر، چند نمونه از اعلان‌های ضعیف عبارتند از:

“همه چیز””چه چیزی می توانید به من بگویید؟””آنچه می دانی”

با پیروی از این دستورالعمل‌ها، می‌توانید اطمینان حاصل کنید که هنگام استفاده از ChatGPT، دقیق‌ترین و مرتبط‌ترین پاسخ‌ها را از مدل دریافت می‌کنید.

5.2. به عنوان یک دانشمند داده به خاطر داشته باشید

ChatGPT کامل نیست. مثال ارائه شده از sklearn است. در دنیای واقعی، باید داده های خود را از منبع خود با استفاده از پانداها بارگیری کنید (مثال زیر بارگیری عنبیه را از حافظه محلی نشان می دهد).

به طور کلی، به عنوان یک دانشمند داده، شما اغلب با فرآیند چند وجهی جمع آوری داده ها، آماده سازی، ساخت مدل و تفسیر مواجه خواهید شد. این مراحل هر کدام از نظر مهارت ها و منابع نیازمندی های منحصر به فرد خود را دارند. به عنوان مثال، می توانید از پانداها برای بارگیری و دستکاری مجموعه داده های خود استفاده کنید. مهم است که به خاطر داشته باشید که نمونه‌های ارائه شده توسط ChatGPT به عنوان یک کمک آموزشی پایه در نظر گرفته شده‌اند و ممکن است برای مدیریت مجموعه داده‌های پیچیده‌تر یا قابل توجه‌تر مناسب نباشند.

5.3. چت وحشت نکنید GPT قرار نیست جایگزین دانشمند داده شود (هنوز!)

بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.

دلایل متعددی وجود دارد که چرا ChatGPT و دیگر مدل های زبان بزرگ قرار نیست جایگزین دانشمندان داده شوند:

دانشمندان داده دارای مجموعه مهارت های بسیار گسترده تری هستند: دانشمندان داده در طیف گسترده ای از مهارت ها از جمله تجزیه و تحلیل داده ها، یادگیری ماشین، برنامه نویسی، آمار و موارد دیگر آموزش می بینند. ChatGPT و دیگر مدل‌های زبان بزرگ فقط قادر به تولید متن بر اساس یک دستور داده شده هستند و مهارت‌های دیگری که دانشمندان داده دارند را ندارند.

دانشمندان داده می توانند نتایج کار خود را تفسیر و توضیح دهند: دانشمندان داده برای تفسیر و توضیح نتایج کار خود آموزش می بینند که برای تصمیم گیری و ارتباط با ذینفعان بسیار مهم است. ChatGPT و دیگر مدل های زبان بزرگ قادر به تفسیر یا توضیح نتایج کار خود نیستند.

دانشمندان داده می توانند با طیف وسیعی از داده ها کار کنند: دانشمندان داده برای کار با طیف گسترده ای از داده ها، از جمله داده های ساختاریافته و بدون ساختار آموزش دیده اند و می توانند از ابزارها و تکنیک های مختلفی برای استخراج بینش از داده ها استفاده کنند. ChatGPT و دیگر مدل‌های زبان بزرگ فقط قادر به تولید متن بر اساس یک درخواست خاص هستند و قادر به کار با انواع دیگر داده‌ها نیستند.

دانشمندان داده می توانند با طیف وسیعی از ذینفعان کار کنند: دانشمندان داده برای کار با طیف گسترده ای از ذینفعان، از جمله رهبران کسب و کار، کارشناسان موضوعی، و کارشناسان فنی آموزش دیده اند و می توانند مفاهیم پیچیده را به روشی واضح و قابل درک به اشتراک بگذارند. ChatGPT و دیگر مدل های زبان بزرگ قادر به کار با ذینفعان یا برقراری ارتباط مفاهیم پیچیده نیستند.

این پروژه راهنمایی دوستانه مبتدی + سایر دوره های رایگان که توسط توسعه دهندگان IBM و دانشمندان داده در https://cognitiveclass.ai/ ایجاد شده است را بررسی کنید.

تا دفعه بعد!

توضیحات تصویر

آیا می خواهید ترسیم در پایتون را یاد بگیرید؟ ChatGPT به شما کمک خواهد کرد.

این پروژه از ChatGPT می خواهد تا به شما یاد دهد که چگونه کد پایتون را برای ایجاد نمودارها و تجسم ها تولید کنید. به سادگی شرح مختصری از طرحی که می خواهید ایجاد کنید ارائه دهید و ChatGPT کد لازم را با استفاده از کتابخانه محبوب Matplotlib ایجاد می کند. این ابزار حتی به کاربرانی که تجربه برنامه نویسی ندارند نیز اجازه می دهد تا نمودارهای حرفه ای برای داده های خود ایجاد کنند. چه محقق، دانشمند داده یا دانش آموز باشید، ChatGPT ایجاد طرح های زیبا و آموزنده در پایتون را آسان می کند. (تولید شده توسط ChatGPT با تغییرات جزئی).

پروژه در JupyterNotebook در دسترس است رایگان در کلاس شناختی


1. بیایید در مورد حوزه خاص مورد علاقه خود که می خواهیم یاد بگیریم بپرسیم.

پرسیدن: “به من بیاموز چگونه در پایتون نقشه بکشم”
نتیجه:
راه های زیادی برای رسم داده ها در پایتون وجود دارد. در اینجا یک مثال ساده با استفاده از Matplotlib، یک کتابخانه تجسم داده محبوب در پایتون آورده شده است:

# using the provided by chatGPT to run in the notebook
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.plot(x, y)
# Add a title
ax.set_title('My Plot')
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

این یک نمودار خطی ساده از داده ها در x و y ایجاد می کند. گزینه ها و گزینه های سفارشی سازی زیادی برای ایجاد نمودار در Matplotlib وجود دارد. به عنوان مثال، می توانید ظاهر خطوط را تغییر دهید، برچسب های محور را تغییر دهید، یک افسانه و غیره اضافه کنید.

در اینجا اطلاعات بیشتری در مورد Matplotlib و دیگر کتابخانه های رسم در پایتون آمده است:
اسناد Matplotlib: https://matplotlib.org/stable/index.html
آموزش Matplotlib: https://matplotlib.org/stable/tutorials/index.html
Seaborn، یک کتابخانه تجسم داده بر اساس Matplotlib: https://seaborn.pydata.org/
Plotly، کتابخانه ای برای ایجاد نمودارهای تعاملی: https://plotly.com/python/

همانطور که می بینید، ChatGPT بلوک های متن و کد مقدماتی (با نماد کپی برای راحتی) فراهم می کند و مکالمه را با اطلاعات مفید اضافی به پایان می رساند.

2. می توانید سوالات بعدی را بپرسید

با پرسیدن ساده “نمونه های بیشتری از نقشه ها در پایتون را به من نشان دهید”. در واقع chatGPT مکالمات قبلی شما را به خاطر می آورد.
نتیجه:
در اینجا چند نمونه دیگر از نمودارهایی وجود دارد که می توانید در پایتون با استفاده از کتابخانه Matplotlib ایجاد کنید: طرح پراکندگی

import matplotlib.pyplot as plt

# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data
ax.scatter(x, y)

# Add a title
ax.set_title('My Scatter Plot')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

طرح نوار

import matplotlib.pyplot as plt

# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data
ax.bar(x, y)

# Add a title
ax.set_title('My Bar Plot')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

نمودار دایره ای

import matplotlib.pyplot as plt

# Sample data
labels = ['Apples', 'Bananas', 'Oranges']
sizes = [30, 45, 25]

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data
ax.pie(sizes, labels=labels)

# Add a title
ax.set_title('My Pie Chart')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

به خاطر داشته باشید که اینها تنها چند نمونه هستند و انواع دیگری از نمودارها وجود دارد که می توانید با استفاده از Matplotlib در پایتون ایجاد کنید. می توانید اطلاعات و نمونه های بیشتر را در مستندات Matplotlib بیابید: https://matplotlib.org/stable/index.html.

بیایید از یک مجموعه داده نمونه رسم کنیم

3. چند مجموعه داده نمونه را پیشنهاد دهید

مرحله اولیه که برای بارگیری داده ها نیاز دارید. می‌توانیم از ChatGPT بخواهیم که با پرسیدن چند مجموعه داده نمونه را پیشنهاد کند “آیا می توانید مجموعه داده های نمونه برای مبتدیان پایتون را به من بگویید؟”
نتیجه:
مطمئنا! در اینجا چند مجموعه داده وجود دارد که ممکن است برای مبتدیان در پایتون مفید باشد:

مجموعه داده زنبق: این مجموعه داده کوچکی است که حاوی اطلاعاتی در مورد گونه های مختلف گل زنبق، از جمله طول و عرض کاسبرگ و گلبرگ است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های یادگیری ماشین و تجزیه و تحلیل داده ها استفاده می شود. می توانید مجموعه داده Iris را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.

مجموعه داده مسکن بوستون: این مجموعه داده حاوی اطلاعاتی در مورد قیمت مسکن در منطقه بوستون، از جمله ارزش متوسط ​​خانه ها، نرخ جرم و جنایت و عوامل دیگر است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های رگرسیون استفاده می شود. شما می توانید مجموعه داده Boston Housing را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.

مجموعه داده MNIST: این مجموعه داده ای از ارقام دست نویس است که 60000 نمونه آموزشی و 10000 نمونه آزمایشی دارد. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های طبقه بندی تصاویر استفاده می شود. می توانید مجموعه داده MNIST را در پایتون با استفاده از ماژول keras.datasets بارگیری کنید.

از میان این مجموعه داده های پیشنهادی، مجموعه داده Iris را برای ادامه کار به عنوان نمونه انتخاب می کنیم.

3.1. مجموعه داده عنبیه را به عنوان نمونه بارگیری کنید تا هوشمندانه کار کنید

ساعت

ما به یک نمونه مناسب در قالب جدول نیاز داریم، بنابراین ما پرسیدیم “بارگیری داده های عنبیه با فرمت جدولی”
نتیجه:

برای بارگذاری مجموعه داده های Iris در قالب جدول مانند در پایتون، می توانید از کتابخانه Pandas استفاده کنید. در اینجا مثالی از نحوه بارگیری مجموعه داده های Iris و نمایش آن در قالب جدولی آورده شده است:

import pandas as pd
from sklearn import datasets

# Load the Iris dataset
iris = datasets.load_iris()

# Create a DataFrame with the features and target values
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target

# Display the DataFrame
print(df)
#--> or we can call the dataset to displace it
df
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

_این یک Pandas DataFrame با ویژگی های (طول کاسبرگ، عرض کاسبرگ، طول گلبرگ و عرض گلبرگ) مجموعه داده عنبیه به عنوان ستون، و مقادیر هدف (نوع عنبیه) به عنوان یک ستون اضافی ایجاد می کند.

سپس می توانید از توابع معمول پانداها برای دستکاری و تجزیه و تحلیل داده ها در DataFrame استفاده کنید. برای مثال، می‌توانید از تابع head() برای نمایش چند ردیف اول DataFrame استفاده کنید، یا از تابع describe() برای دریافت آمار خلاصه برای ستون‌های عددی استفاده کنید._

4. مجموعه داده را رسم کنید

به راحتی می‌توانیم سؤالات بعدی را بپرسیم. اینجا پرسیدیم “طرح آن”
نتیجه:

برای رسم مجموعه داده Iris با استفاده از Matplotlib، می توانید از کد زیر استفاده کنید:

# --> Trying of the suggestions from ChatGPT
# --> we removed the redundant lines (e.g. loading libraries and importing data) from the suggestion

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the data, coloring the points by the target values
scatter = ax.scatter(df['sepal length (cm)'], df['sepal width (cm)'], c=df['target'])

# Add a legend
legend = ax.legend(*scatter.legend_elements(), title="Species")

# Add a title
ax.set_title('Iris dataset')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

4.1. ستون مخصوص طرح

ما انتخاب می کنیم و می خواهیم یک ستون خاص را در مجموعه داده رسم کنیم. به عنوان مثال، پرسیدن “توزیع ستون “طول کاسبرگ (سانتی متر) را به من نشان دهید”
نتیجه:

برای نشان دادن توزیع یک ستون در Pandas DataFrame، می توانید از تابع hist() DataFrame استفاده کنید. به عنوان مثال، برای نشان دادن توزیع ستون 'sepal length (cm)' در مجموعه داده Iris، می توانید از کد زیر استفاده کنید:

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the distribution of the 'sepal length (cm)' column
df['sepal length (cm)'].hist(ax=ax)

# Add a title
ax.set_title('Distribution of sepal length')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

همانطور که متوجه شدید، طرح فاقد برچسب است. بنابراین، می‌توانیم ** بپرسیم «آن را با برچسب‌های محور مناسب انجام دهید».
نتیجه:
**

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the distribution of the 'sepal length (cm)' column
df['sepal length (cm)'].hist(ax=ax)

# Add axis labels
ax.set_xlabel('Sepal length (cm)')
ax.set_ylabel('Frequency')

# Add a title
ax.set_title('Distribution of sepal length')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

4.2. طرح پیچیده تر

یکی دیگر از نمودارهای مفید برای نشان دادن توزیع، استفاده از نمودار جعبه است که ما را قادر می سازد انحراف استاندارد را تجسم کنیم و نقاط پرت را شناسایی کنیم.

در اینجا ما برای تمام ستون های نشان داده شده در نمودار واحد درخواست می کنیم از شما می‌پرسد: «نشان دهید نمودار باکسی از توزیع همه ستون‌ها در یک طرح».
نتیجه:

برای نشان دادن توزیع تمام ستون‌ها در Pandas DataFrame به‌عنوان باکس‌پلات در یک نمودار، می‌توانید از تابع boxplot() DataFrame استفاده کنید.

به عنوان مثال، برای نشان دادن توزیع تمام ستون‌ها در مجموعه داده عنبیه به‌عنوان باکس پلات، می‌توانید از کد زیر استفاده کنید:

import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets

# Load the Iris dataset
iris = datasets.load_iris()

# Create a DataFrame with the features
df = pd.DataFrame(iris.data, columns=iris.feature_names)

# Add a column with the target values
df['target'] = iris.target

# Create a figure and an axes
fig, ax = plt.subplots()

# Plot the boxplots of all columns
df.boxplot(ax=ax)

# Add a title
ax.set_title('Distributions of all columns')

# Show the plot
plt.show()
وارد حالت تمام صفحه شوید

از حالت تمام صفحه خارج شوید

توضیحات تصویر

5. استفاده از chatGPT برای پروژه خود

ChatGPT یک ابزار عالی برای کار بر روی پروژه شما است. مهم است که سؤال را به گونه ای طرح کنید که مشکل شما را برطرف کند. به خاطر داشته باشید که تقسیم پروژه خود به بلوک های کوچکتر و پرداختن به آنها به صورت جداگانه، کلید پرداختن به پروژه است.

برای پرسیدن یک سوال برنامه نویسی از ChatGPT، می توانید به سادگی یک توضیح واضح و مختصر از مشکل خود به همراه هر کد یا پیام خطا مربوطه ارائه دهید. همچنین باید زبان برنامه نویسی و کتابخانه ها یا فریم ورک هایی که استفاده می کنید را مشخص کنید.

5.1. نحوه درست فرموله کردن یک سوال (معروف به درخواست) برای ChatGPT

بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.

هنگام فرموله کردن یک درخواست برای ChatGPT، مهم است که چند نکته را در نظر داشته باشید تا بهترین استفاده را از مدل ببرید:
در مورد کاری که می خواهید مدل انجام دهد، مشخص و واضح باشید. به عنوان مثال، به جای اینکه بپرسید «در مورد این موضوع چه می‌دانید؟»، بپرسید «آیا می‌توانید یک مرور مختصر از تاریخچه موضوع ارائه دهید؟»

در صورت لزوم زمینه را ارائه دهید. اگر در مورد یک رویداد یا شخص خاص سؤالی می‌پرسید، اطلاعات زمینه‌ای را ارائه دهید تا مدل بتواند زمینه‌ای را که در آن سؤال می‌پرسید، درک کند.

مختصر باشد. درک پیام‌های طولانی و پیچیده برای مدل دشوار است و ممکن است منجر به پاسخ‌های کمتر دقیق یا مرتبط شود.

از استفاده از زبان یا اصطلاحات بسیار فنی که ممکن است مدل با آن آشنا نباشد، خودداری کنید.

از پرسیدن چند سوال در یک درخواست خودداری کنید، بهتر است هر بار یک سوال بپرسید.

در اینجا چند نمونه از دستورات خوب برای ChatGPT آورده شده است:
“آیا می توانید تفاوت اصلی بین یادگیری تحت نظارت و بدون نظارت را توضیح دهید؟”

اجزای اصلی یک شبکه عصبی چیست و چگونه کار می کنند؟

“لطفا یک داستان کوتاه در مورد رباتی بنویسید که می تواند ذهن ها را بخواند”

از سوی دیگر، چند نمونه از اعلان‌های ضعیف عبارتند از:

“همه چیز”
“چه چیزی می توانید به من بگویید؟”
“آنچه می دانی”

با پیروی از این دستورالعمل‌ها، می‌توانید اطمینان حاصل کنید که هنگام استفاده از ChatGPT، دقیق‌ترین و مرتبط‌ترین پاسخ‌ها را از مدل دریافت می‌کنید.

5.2. به عنوان یک دانشمند داده به خاطر داشته باشید

ChatGPT کامل نیست. مثال ارائه شده از sklearn است. در دنیای واقعی، باید داده های خود را از منبع خود با استفاده از پانداها بارگیری کنید (مثال زیر بارگیری عنبیه را از حافظه محلی نشان می دهد).

به طور کلی، به عنوان یک دانشمند داده، شما اغلب با فرآیند چند وجهی جمع آوری داده ها، آماده سازی، ساخت مدل و تفسیر مواجه خواهید شد. این مراحل هر کدام از نظر مهارت ها و منابع نیازمندی های منحصر به فرد خود را دارند. به عنوان مثال، می توانید از پانداها برای بارگیری و دستکاری مجموعه داده های خود استفاده کنید. مهم است که به خاطر داشته باشید که نمونه‌های ارائه شده توسط ChatGPT به عنوان یک کمک آموزشی پایه در نظر گرفته شده‌اند و ممکن است برای مدیریت مجموعه داده‌های پیچیده‌تر یا قابل توجه‌تر مناسب نباشند.

5.3. چت وحشت نکنید GPT قرار نیست جایگزین دانشمند داده شود (هنوز!)

بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.

دلایل متعددی وجود دارد که چرا ChatGPT و دیگر مدل های زبان بزرگ قرار نیست جایگزین دانشمندان داده شوند:

دانشمندان داده دارای مجموعه مهارت های بسیار گسترده تری هستند: دانشمندان داده در طیف گسترده ای از مهارت ها از جمله تجزیه و تحلیل داده ها، یادگیری ماشین، برنامه نویسی، آمار و موارد دیگر آموزش می بینند. ChatGPT و دیگر مدل‌های زبان بزرگ فقط قادر به تولید متن بر اساس یک دستور داده شده هستند و مهارت‌های دیگری که دانشمندان داده دارند را ندارند.

دانشمندان داده می توانند نتایج کار خود را تفسیر و توضیح دهند: دانشمندان داده برای تفسیر و توضیح نتایج کار خود آموزش می بینند که برای تصمیم گیری و ارتباط با ذینفعان بسیار مهم است. ChatGPT و دیگر مدل های زبان بزرگ قادر به تفسیر یا توضیح نتایج کار خود نیستند.

دانشمندان داده می توانند با طیف وسیعی از داده ها کار کنند: دانشمندان داده برای کار با طیف گسترده ای از داده ها، از جمله داده های ساختاریافته و بدون ساختار آموزش دیده اند و می توانند از ابزارها و تکنیک های مختلفی برای استخراج بینش از داده ها استفاده کنند. ChatGPT و دیگر مدل‌های زبان بزرگ فقط قادر به تولید متن بر اساس یک درخواست خاص هستند و قادر به کار با انواع دیگر داده‌ها نیستند.

دانشمندان داده می توانند با طیف وسیعی از ذینفعان کار کنند: دانشمندان داده برای کار با طیف گسترده ای از ذینفعان، از جمله رهبران کسب و کار، کارشناسان موضوعی، و کارشناسان فنی آموزش دیده اند و می توانند مفاهیم پیچیده را به روشی واضح و قابل درک به اشتراک بگذارند. ChatGPT و دیگر مدل های زبان بزرگ قادر به کار با ذینفعان یا برقراری ارتباط مفاهیم پیچیده نیستند.

این پروژه راهنمایی دوستانه مبتدی + سایر دوره های رایگان که توسط توسعه دهندگان IBM و دانشمندان داده در https://cognitiveclass.ai/ ایجاد شده است را بررسی کنید.

تا دفعه بعد!

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا