پروژه رایگان: از ChatGPT برای رسم با پایتون و Matplotlib استفاده کنید

Summarize this content to 400 words in Persian Lang
آیا می خواهید ترسیم در پایتون را یاد بگیرید؟ ChatGPT به شما کمک خواهد کرد.
این پروژه از ChatGPT می خواهد تا به شما یاد دهد که چگونه کد پایتون را برای ایجاد نمودارها و تجسم ها تولید کنید. به سادگی شرح مختصری از طرحی که می خواهید ایجاد کنید ارائه دهید و ChatGPT کد لازم را با استفاده از کتابخانه محبوب Matplotlib ایجاد می کند. این ابزار حتی به کاربرانی که تجربه برنامه نویسی ندارند نیز اجازه می دهد تا نمودارهای حرفه ای برای داده های خود ایجاد کنند. چه محقق، دانشمند داده یا دانش آموز باشید، ChatGPT ایجاد طرح های زیبا و آموزنده در پایتون را آسان می کند. (تولید شده توسط ChatGPT با تغییرات جزئی).
پروژه در JupyterNotebook در دسترس است رایگان در کلاس شناختی
1. بیایید در مورد حوزه خاص مورد علاقه خود که می خواهیم یاد بگیریم بپرسیم.
پرسیدن: “به من بیاموز چگونه در پایتون نقشه بکشم”نتیجه:راه های زیادی برای رسم داده ها در پایتون وجود دارد. در اینجا یک مثال ساده با استفاده از Matplotlib، یک کتابخانه تجسم داده محبوب در پایتون آورده شده است:
# using the provided by chatGPT to run in the notebook
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.plot(x, y)
# Add a title
ax.set_title(‘My Plot’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
این یک نمودار خطی ساده از داده ها در x و y ایجاد می کند. گزینه ها و گزینه های سفارشی سازی زیادی برای ایجاد نمودار در Matplotlib وجود دارد. به عنوان مثال، می توانید ظاهر خطوط را تغییر دهید، برچسب های محور را تغییر دهید، یک افسانه و غیره اضافه کنید.
در اینجا اطلاعات بیشتری در مورد Matplotlib و دیگر کتابخانه های رسم در پایتون آمده است:اسناد Matplotlib: https://matplotlib.org/stable/index.htmlآموزش Matplotlib: https://matplotlib.org/stable/tutorials/index.htmlSeaborn، یک کتابخانه تجسم داده بر اساس Matplotlib: https://seaborn.pydata.org/Plotly، کتابخانه ای برای ایجاد نمودارهای تعاملی: https://plotly.com/python/
همانطور که می بینید، ChatGPT بلوک های متن و کد مقدماتی (با نماد کپی برای راحتی) فراهم می کند و مکالمه را با اطلاعات مفید اضافی به پایان می رساند.
2. می توانید سوالات بعدی را بپرسید
با پرسیدن ساده “نمونه های بیشتری از نقشه ها در پایتون را به من نشان دهید”. در واقع chatGPT مکالمات قبلی شما را به خاطر می آورد.نتیجه:در اینجا چند نمونه دیگر از نمودارهایی وجود دارد که می توانید در پایتون با استفاده از کتابخانه Matplotlib ایجاد کنید: طرح پراکندگی
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.scatter(x, y)
# Add a title
ax.set_title(‘My Scatter Plot’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
طرح نوار
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.bar(x, y)
# Add a title
ax.set_title(‘My Bar Plot’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
نمودار دایره ای
import matplotlib.pyplot as plt
# Sample data
labels = [‘Apples’, ‘Bananas’, ‘Oranges’]
sizes = [30, 45, 25]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.pie(sizes, labels=labels)
# Add a title
ax.set_title(‘My Pie Chart’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
به خاطر داشته باشید که اینها تنها چند نمونه هستند و انواع دیگری از نمودارها وجود دارد که می توانید با استفاده از Matplotlib در پایتون ایجاد کنید. می توانید اطلاعات و نمونه های بیشتر را در مستندات Matplotlib بیابید: https://matplotlib.org/stable/index.html.
بیایید از یک مجموعه داده نمونه رسم کنیم
3. چند مجموعه داده نمونه را پیشنهاد دهید
مرحله اولیه که برای بارگیری داده ها نیاز دارید. میتوانیم از ChatGPT بخواهیم که با پرسیدن چند مجموعه داده نمونه را پیشنهاد کند “آیا می توانید مجموعه داده های نمونه برای مبتدیان پایتون را به من بگویید؟”نتیجه:مطمئنا! در اینجا چند مجموعه داده وجود دارد که ممکن است برای مبتدیان در پایتون مفید باشد:
مجموعه داده زنبق: این مجموعه داده کوچکی است که حاوی اطلاعاتی در مورد گونه های مختلف گل زنبق، از جمله طول و عرض کاسبرگ و گلبرگ است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های یادگیری ماشین و تجزیه و تحلیل داده ها استفاده می شود. می توانید مجموعه داده Iris را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.
مجموعه داده مسکن بوستون: این مجموعه داده حاوی اطلاعاتی در مورد قیمت مسکن در منطقه بوستون، از جمله ارزش متوسط خانه ها، نرخ جرم و جنایت و عوامل دیگر است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های رگرسیون استفاده می شود. شما می توانید مجموعه داده Boston Housing را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.
مجموعه داده MNIST: این مجموعه داده ای از ارقام دست نویس است که 60000 نمونه آموزشی و 10000 نمونه آزمایشی دارد. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های طبقه بندی تصاویر استفاده می شود. می توانید مجموعه داده MNIST را در پایتون با استفاده از ماژول keras.datasets بارگیری کنید.
از میان این مجموعه داده های پیشنهادی، مجموعه داده Iris را برای ادامه کار به عنوان نمونه انتخاب می کنیم.
3.1. مجموعه داده عنبیه را به عنوان نمونه بارگیری کنید تا هوشمندانه کار کنید
ساعت
ما به یک نمونه مناسب در قالب جدول نیاز داریم، بنابراین ما پرسیدیم “بارگیری داده های عنبیه با فرمت جدولی”نتیجه:برای بارگذاری مجموعه داده های Iris در قالب جدول مانند در پایتون، می توانید از کتابخانه Pandas استفاده کنید. در اینجا مثالی از نحوه بارگیری مجموعه داده های Iris و نمایش آن در قالب جدولی آورده شده است:
import pandas as pd
from sklearn import datasets
# Load the Iris dataset
iris = datasets.load_iris()
# Create a DataFrame with the features and target values
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df[‘target’] = iris.target
# Display the DataFrame
print(df)
#–> or we can call the dataset to displace it
df
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
_این یک Pandas DataFrame با ویژگی های (طول کاسبرگ، عرض کاسبرگ، طول گلبرگ و عرض گلبرگ) مجموعه داده عنبیه به عنوان ستون، و مقادیر هدف (نوع عنبیه) به عنوان یک ستون اضافی ایجاد می کند.
سپس می توانید از توابع معمول پانداها برای دستکاری و تجزیه و تحلیل داده ها در DataFrame استفاده کنید. برای مثال، میتوانید از تابع head() برای نمایش چند ردیف اول DataFrame استفاده کنید، یا از تابع describe() برای دریافت آمار خلاصه برای ستونهای عددی استفاده کنید._
4. مجموعه داده را رسم کنید
به راحتی میتوانیم سؤالات بعدی را بپرسیم. اینجا پرسیدیم “طرح آن”نتیجه:برای رسم مجموعه داده Iris با استفاده از Matplotlib، می توانید از کد زیر استفاده کنید:
# –> Trying of the suggestions from ChatGPT
# –> we removed the redundant lines (e.g. loading libraries and importing data) from the suggestion
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data, coloring the points by the target values
scatter = ax.scatter(df[‘sepal length (cm)’], df[‘sepal width (cm)’], c=df[‘target’])
# Add a legend
legend = ax.legend(*scatter.legend_elements(), title=”Species”)
# Add a title
ax.set_title(‘Iris dataset’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
4.1. ستون مخصوص طرح
ما انتخاب می کنیم و می خواهیم یک ستون خاص را در مجموعه داده رسم کنیم. به عنوان مثال، پرسیدن “توزیع ستون “طول کاسبرگ (سانتی متر) را به من نشان دهید”نتیجه:
برای نشان دادن توزیع یک ستون در Pandas DataFrame، می توانید از تابع hist() DataFrame استفاده کنید. به عنوان مثال، برای نشان دادن توزیع ستون 'sepal length (cm)' در مجموعه داده Iris، می توانید از کد زیر استفاده کنید:
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the distribution of the ‘sepal length (cm)’ column
df[‘sepal length (cm)’].hist(ax=ax)
# Add a title
ax.set_title(‘Distribution of sepal length’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
همانطور که متوجه شدید، طرح فاقد برچسب است. بنابراین، میتوانیم ** بپرسیم «آن را با برچسبهای محور مناسب انجام دهید».نتیجه:**
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the distribution of the ‘sepal length (cm)’ column
df[‘sepal length (cm)’].hist(ax=ax)
# Add axis labels
ax.set_xlabel(‘Sepal length (cm)’)
ax.set_ylabel(‘Frequency’)
# Add a title
ax.set_title(‘Distribution of sepal length’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
4.2. طرح پیچیده تر
یکی دیگر از نمودارهای مفید برای نشان دادن توزیع، استفاده از نمودار جعبه است که ما را قادر می سازد انحراف استاندارد را تجسم کنیم و نقاط پرت را شناسایی کنیم.
در اینجا ما برای تمام ستون های نشان داده شده در نمودار واحد درخواست می کنیم از شما میپرسد: «نشان دهید نمودار باکسی از توزیع همه ستونها در یک طرح».نتیجه:
برای نشان دادن توزیع تمام ستونها در Pandas DataFrame بهعنوان باکسپلات در یک نمودار، میتوانید از تابع boxplot() DataFrame استفاده کنید.
به عنوان مثال، برای نشان دادن توزیع تمام ستونها در مجموعه داده عنبیه بهعنوان باکس پلات، میتوانید از کد زیر استفاده کنید:
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets
# Load the Iris dataset
iris = datasets.load_iris()
# Create a DataFrame with the features
df = pd.DataFrame(iris.data, columns=iris.feature_names)
# Add a column with the target values
df[‘target’] = iris.target
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the boxplots of all columns
df.boxplot(ax=ax)
# Add a title
ax.set_title(‘Distributions of all columns’)
# Show the plot
plt.show()
وارد حالت تمام صفحه شوید
از حالت تمام صفحه خارج شوید
5. استفاده از chatGPT برای پروژه خود
ChatGPT یک ابزار عالی برای کار بر روی پروژه شما است. مهم است که سؤال را به گونه ای طرح کنید که مشکل شما را برطرف کند. به خاطر داشته باشید که تقسیم پروژه خود به بلوک های کوچکتر و پرداختن به آنها به صورت جداگانه، کلید پرداختن به پروژه است.
برای پرسیدن یک سوال برنامه نویسی از ChatGPT، می توانید به سادگی یک توضیح واضح و مختصر از مشکل خود به همراه هر کد یا پیام خطا مربوطه ارائه دهید. همچنین باید زبان برنامه نویسی و کتابخانه ها یا فریم ورک هایی که استفاده می کنید را مشخص کنید.
5.1. نحوه درست فرموله کردن یک سوال (معروف به درخواست) برای ChatGPT
بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.
هنگام فرموله کردن یک درخواست برای ChatGPT، مهم است که چند نکته را در نظر داشته باشید تا بهترین استفاده را از مدل ببرید:در مورد کاری که می خواهید مدل انجام دهد، مشخص و واضح باشید. به عنوان مثال، به جای اینکه بپرسید «در مورد این موضوع چه میدانید؟»، بپرسید «آیا میتوانید یک مرور مختصر از تاریخچه موضوع ارائه دهید؟»
در صورت لزوم زمینه را ارائه دهید. اگر در مورد یک رویداد یا شخص خاص سؤالی میپرسید، اطلاعات زمینهای را ارائه دهید تا مدل بتواند زمینهای را که در آن سؤال میپرسید، درک کند.
مختصر باشد. درک پیامهای طولانی و پیچیده برای مدل دشوار است و ممکن است منجر به پاسخهای کمتر دقیق یا مرتبط شود.
از استفاده از زبان یا اصطلاحات بسیار فنی که ممکن است مدل با آن آشنا نباشد، خودداری کنید.
از پرسیدن چند سوال در یک درخواست خودداری کنید، بهتر است هر بار یک سوال بپرسید.
در اینجا چند نمونه از دستورات خوب برای ChatGPT آورده شده است:”آیا می توانید تفاوت اصلی بین یادگیری تحت نظارت و بدون نظارت را توضیح دهید؟”
اجزای اصلی یک شبکه عصبی چیست و چگونه کار می کنند؟
“لطفا یک داستان کوتاه در مورد رباتی بنویسید که می تواند ذهن ها را بخواند”
از سوی دیگر، چند نمونه از اعلانهای ضعیف عبارتند از:
“همه چیز””چه چیزی می توانید به من بگویید؟””آنچه می دانی”
با پیروی از این دستورالعملها، میتوانید اطمینان حاصل کنید که هنگام استفاده از ChatGPT، دقیقترین و مرتبطترین پاسخها را از مدل دریافت میکنید.
5.2. به عنوان یک دانشمند داده به خاطر داشته باشید
ChatGPT کامل نیست. مثال ارائه شده از sklearn است. در دنیای واقعی، باید داده های خود را از منبع خود با استفاده از پانداها بارگیری کنید (مثال زیر بارگیری عنبیه را از حافظه محلی نشان می دهد).
به طور کلی، به عنوان یک دانشمند داده، شما اغلب با فرآیند چند وجهی جمع آوری داده ها، آماده سازی، ساخت مدل و تفسیر مواجه خواهید شد. این مراحل هر کدام از نظر مهارت ها و منابع نیازمندی های منحصر به فرد خود را دارند. به عنوان مثال، می توانید از پانداها برای بارگیری و دستکاری مجموعه داده های خود استفاده کنید. مهم است که به خاطر داشته باشید که نمونههای ارائه شده توسط ChatGPT به عنوان یک کمک آموزشی پایه در نظر گرفته شدهاند و ممکن است برای مدیریت مجموعه دادههای پیچیدهتر یا قابل توجهتر مناسب نباشند.
5.3. چت وحشت نکنید GPT قرار نیست جایگزین دانشمند داده شود (هنوز!)
بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.
دلایل متعددی وجود دارد که چرا ChatGPT و دیگر مدل های زبان بزرگ قرار نیست جایگزین دانشمندان داده شوند:
دانشمندان داده دارای مجموعه مهارت های بسیار گسترده تری هستند: دانشمندان داده در طیف گسترده ای از مهارت ها از جمله تجزیه و تحلیل داده ها، یادگیری ماشین، برنامه نویسی، آمار و موارد دیگر آموزش می بینند. ChatGPT و دیگر مدلهای زبان بزرگ فقط قادر به تولید متن بر اساس یک دستور داده شده هستند و مهارتهای دیگری که دانشمندان داده دارند را ندارند.
دانشمندان داده می توانند نتایج کار خود را تفسیر و توضیح دهند: دانشمندان داده برای تفسیر و توضیح نتایج کار خود آموزش می بینند که برای تصمیم گیری و ارتباط با ذینفعان بسیار مهم است. ChatGPT و دیگر مدل های زبان بزرگ قادر به تفسیر یا توضیح نتایج کار خود نیستند.
دانشمندان داده می توانند با طیف وسیعی از داده ها کار کنند: دانشمندان داده برای کار با طیف گسترده ای از داده ها، از جمله داده های ساختاریافته و بدون ساختار آموزش دیده اند و می توانند از ابزارها و تکنیک های مختلفی برای استخراج بینش از داده ها استفاده کنند. ChatGPT و دیگر مدلهای زبان بزرگ فقط قادر به تولید متن بر اساس یک درخواست خاص هستند و قادر به کار با انواع دیگر دادهها نیستند.
دانشمندان داده می توانند با طیف وسیعی از ذینفعان کار کنند: دانشمندان داده برای کار با طیف گسترده ای از ذینفعان، از جمله رهبران کسب و کار، کارشناسان موضوعی، و کارشناسان فنی آموزش دیده اند و می توانند مفاهیم پیچیده را به روشی واضح و قابل درک به اشتراک بگذارند. ChatGPT و دیگر مدل های زبان بزرگ قادر به کار با ذینفعان یا برقراری ارتباط مفاهیم پیچیده نیستند.
این پروژه راهنمایی دوستانه مبتدی + سایر دوره های رایگان که توسط توسعه دهندگان IBM و دانشمندان داده در https://cognitiveclass.ai/ ایجاد شده است را بررسی کنید.
تا دفعه بعد!
آیا می خواهید ترسیم در پایتون را یاد بگیرید؟ ChatGPT به شما کمک خواهد کرد.
این پروژه از ChatGPT می خواهد تا به شما یاد دهد که چگونه کد پایتون را برای ایجاد نمودارها و تجسم ها تولید کنید. به سادگی شرح مختصری از طرحی که می خواهید ایجاد کنید ارائه دهید و ChatGPT کد لازم را با استفاده از کتابخانه محبوب Matplotlib ایجاد می کند. این ابزار حتی به کاربرانی که تجربه برنامه نویسی ندارند نیز اجازه می دهد تا نمودارهای حرفه ای برای داده های خود ایجاد کنند. چه محقق، دانشمند داده یا دانش آموز باشید، ChatGPT ایجاد طرح های زیبا و آموزنده در پایتون را آسان می کند. (تولید شده توسط ChatGPT با تغییرات جزئی).
پروژه در JupyterNotebook در دسترس است رایگان در کلاس شناختی
1. بیایید در مورد حوزه خاص مورد علاقه خود که می خواهیم یاد بگیریم بپرسیم.
پرسیدن: “به من بیاموز چگونه در پایتون نقشه بکشم”
نتیجه:
راه های زیادی برای رسم داده ها در پایتون وجود دارد. در اینجا یک مثال ساده با استفاده از Matplotlib، یک کتابخانه تجسم داده محبوب در پایتون آورده شده است:
# using the provided by chatGPT to run in the notebook
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.plot(x, y)
# Add a title
ax.set_title('My Plot')
# Show the plot
plt.show()
این یک نمودار خطی ساده از داده ها در x و y ایجاد می کند. گزینه ها و گزینه های سفارشی سازی زیادی برای ایجاد نمودار در Matplotlib وجود دارد. به عنوان مثال، می توانید ظاهر خطوط را تغییر دهید، برچسب های محور را تغییر دهید، یک افسانه و غیره اضافه کنید.
در اینجا اطلاعات بیشتری در مورد Matplotlib و دیگر کتابخانه های رسم در پایتون آمده است:
اسناد Matplotlib: https://matplotlib.org/stable/index.html
آموزش Matplotlib: https://matplotlib.org/stable/tutorials/index.html
Seaborn، یک کتابخانه تجسم داده بر اساس Matplotlib: https://seaborn.pydata.org/
Plotly، کتابخانه ای برای ایجاد نمودارهای تعاملی: https://plotly.com/python/
همانطور که می بینید، ChatGPT بلوک های متن و کد مقدماتی (با نماد کپی برای راحتی) فراهم می کند و مکالمه را با اطلاعات مفید اضافی به پایان می رساند.
2. می توانید سوالات بعدی را بپرسید
با پرسیدن ساده “نمونه های بیشتری از نقشه ها در پایتون را به من نشان دهید”. در واقع chatGPT مکالمات قبلی شما را به خاطر می آورد.
نتیجه:
در اینجا چند نمونه دیگر از نمودارهایی وجود دارد که می توانید در پایتون با استفاده از کتابخانه Matplotlib ایجاد کنید: طرح پراکندگی
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.scatter(x, y)
# Add a title
ax.set_title('My Scatter Plot')
# Show the plot
plt.show()
طرح نوار
import matplotlib.pyplot as plt
# Sample data
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.bar(x, y)
# Add a title
ax.set_title('My Bar Plot')
# Show the plot
plt.show()
نمودار دایره ای
import matplotlib.pyplot as plt
# Sample data
labels = ['Apples', 'Bananas', 'Oranges']
sizes = [30, 45, 25]
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data
ax.pie(sizes, labels=labels)
# Add a title
ax.set_title('My Pie Chart')
# Show the plot
plt.show()
به خاطر داشته باشید که اینها تنها چند نمونه هستند و انواع دیگری از نمودارها وجود دارد که می توانید با استفاده از Matplotlib در پایتون ایجاد کنید. می توانید اطلاعات و نمونه های بیشتر را در مستندات Matplotlib بیابید: https://matplotlib.org/stable/index.html.
بیایید از یک مجموعه داده نمونه رسم کنیم
3. چند مجموعه داده نمونه را پیشنهاد دهید
مرحله اولیه که برای بارگیری داده ها نیاز دارید. میتوانیم از ChatGPT بخواهیم که با پرسیدن چند مجموعه داده نمونه را پیشنهاد کند “آیا می توانید مجموعه داده های نمونه برای مبتدیان پایتون را به من بگویید؟”
نتیجه:
مطمئنا! در اینجا چند مجموعه داده وجود دارد که ممکن است برای مبتدیان در پایتون مفید باشد:مجموعه داده زنبق: این مجموعه داده کوچکی است که حاوی اطلاعاتی در مورد گونه های مختلف گل زنبق، از جمله طول و عرض کاسبرگ و گلبرگ است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های یادگیری ماشین و تجزیه و تحلیل داده ها استفاده می شود. می توانید مجموعه داده Iris را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.
مجموعه داده مسکن بوستون: این مجموعه داده حاوی اطلاعاتی در مورد قیمت مسکن در منطقه بوستون، از جمله ارزش متوسط خانه ها، نرخ جرم و جنایت و عوامل دیگر است. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های رگرسیون استفاده می شود. شما می توانید مجموعه داده Boston Housing را در پایتون با استفاده از ماژول sklearn.datasets بارگیری کنید.
مجموعه داده MNIST: این مجموعه داده ای از ارقام دست نویس است که 60000 نمونه آموزشی و 10000 نمونه آزمایشی دارد. اغلب به عنوان مجموعه داده مبتدی برای یادگیری تکنیک های طبقه بندی تصاویر استفاده می شود. می توانید مجموعه داده MNIST را در پایتون با استفاده از ماژول keras.datasets بارگیری کنید.
از میان این مجموعه داده های پیشنهادی، مجموعه داده Iris را برای ادامه کار به عنوان نمونه انتخاب می کنیم.
3.1. مجموعه داده عنبیه را به عنوان نمونه بارگیری کنید تا هوشمندانه کار کنید
ساعت
ما به یک نمونه مناسب در قالب جدول نیاز داریم، بنابراین ما پرسیدیم “بارگیری داده های عنبیه با فرمت جدولی”
نتیجه:
برای بارگذاری مجموعه داده های Iris در قالب جدول مانند در پایتون، می توانید از کتابخانه Pandas استفاده کنید. در اینجا مثالی از نحوه بارگیری مجموعه داده های Iris و نمایش آن در قالب جدولی آورده شده است:
import pandas as pd
from sklearn import datasets
# Load the Iris dataset
iris = datasets.load_iris()
# Create a DataFrame with the features and target values
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
# Display the DataFrame
print(df)
#--> or we can call the dataset to displace it
df
_این یک Pandas DataFrame با ویژگی های (طول کاسبرگ، عرض کاسبرگ، طول گلبرگ و عرض گلبرگ) مجموعه داده عنبیه به عنوان ستون، و مقادیر هدف (نوع عنبیه) به عنوان یک ستون اضافی ایجاد می کند.
سپس می توانید از توابع معمول پانداها برای دستکاری و تجزیه و تحلیل داده ها در DataFrame استفاده کنید. برای مثال، میتوانید از تابع head() برای نمایش چند ردیف اول DataFrame استفاده کنید، یا از تابع describe() برای دریافت آمار خلاصه برای ستونهای عددی استفاده کنید._
4. مجموعه داده را رسم کنید
به راحتی میتوانیم سؤالات بعدی را بپرسیم. اینجا پرسیدیم “طرح آن”
نتیجه:
برای رسم مجموعه داده Iris با استفاده از Matplotlib، می توانید از کد زیر استفاده کنید:
# --> Trying of the suggestions from ChatGPT
# --> we removed the redundant lines (e.g. loading libraries and importing data) from the suggestion
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the data, coloring the points by the target values
scatter = ax.scatter(df['sepal length (cm)'], df['sepal width (cm)'], c=df['target'])
# Add a legend
legend = ax.legend(*scatter.legend_elements(), title="Species")
# Add a title
ax.set_title('Iris dataset')
# Show the plot
plt.show()
4.1. ستون مخصوص طرح
ما انتخاب می کنیم و می خواهیم یک ستون خاص را در مجموعه داده رسم کنیم. به عنوان مثال، پرسیدن “توزیع ستون “طول کاسبرگ (سانتی متر) را به من نشان دهید”
نتیجه:برای نشان دادن توزیع یک ستون در Pandas DataFrame، می توانید از تابع hist() DataFrame استفاده کنید. به عنوان مثال، برای نشان دادن توزیع ستون 'sepal length (cm)' در مجموعه داده Iris، می توانید از کد زیر استفاده کنید:
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the distribution of the 'sepal length (cm)' column
df['sepal length (cm)'].hist(ax=ax)
# Add a title
ax.set_title('Distribution of sepal length')
# Show the plot
plt.show()
همانطور که متوجه شدید، طرح فاقد برچسب است. بنابراین، میتوانیم ** بپرسیم «آن را با برچسبهای محور مناسب انجام دهید».
نتیجه:**
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the distribution of the 'sepal length (cm)' column
df['sepal length (cm)'].hist(ax=ax)
# Add axis labels
ax.set_xlabel('Sepal length (cm)')
ax.set_ylabel('Frequency')
# Add a title
ax.set_title('Distribution of sepal length')
# Show the plot
plt.show()
4.2. طرح پیچیده تر
یکی دیگر از نمودارهای مفید برای نشان دادن توزیع، استفاده از نمودار جعبه است که ما را قادر می سازد انحراف استاندارد را تجسم کنیم و نقاط پرت را شناسایی کنیم.
در اینجا ما برای تمام ستون های نشان داده شده در نمودار واحد درخواست می کنیم از شما میپرسد: «نشان دهید نمودار باکسی از توزیع همه ستونها در یک طرح».
نتیجه:برای نشان دادن توزیع تمام ستونها در Pandas DataFrame بهعنوان باکسپلات در یک نمودار، میتوانید از تابع boxplot() DataFrame استفاده کنید.
به عنوان مثال، برای نشان دادن توزیع تمام ستونها در مجموعه داده عنبیه بهعنوان باکس پلات، میتوانید از کد زیر استفاده کنید:
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets
# Load the Iris dataset
iris = datasets.load_iris()
# Create a DataFrame with the features
df = pd.DataFrame(iris.data, columns=iris.feature_names)
# Add a column with the target values
df['target'] = iris.target
# Create a figure and an axes
fig, ax = plt.subplots()
# Plot the boxplots of all columns
df.boxplot(ax=ax)
# Add a title
ax.set_title('Distributions of all columns')
# Show the plot
plt.show()
5. استفاده از chatGPT برای پروژه خود
ChatGPT یک ابزار عالی برای کار بر روی پروژه شما است. مهم است که سؤال را به گونه ای طرح کنید که مشکل شما را برطرف کند. به خاطر داشته باشید که تقسیم پروژه خود به بلوک های کوچکتر و پرداختن به آنها به صورت جداگانه، کلید پرداختن به پروژه است.
برای پرسیدن یک سوال برنامه نویسی از ChatGPT، می توانید به سادگی یک توضیح واضح و مختصر از مشکل خود به همراه هر کد یا پیام خطا مربوطه ارائه دهید. همچنین باید زبان برنامه نویسی و کتابخانه ها یا فریم ورک هایی که استفاده می کنید را مشخص کنید.
5.1. نحوه درست فرموله کردن یک سوال (معروف به درخواست) برای ChatGPT
بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.
هنگام فرموله کردن یک درخواست برای ChatGPT، مهم است که چند نکته را در نظر داشته باشید تا بهترین استفاده را از مدل ببرید:
در مورد کاری که می خواهید مدل انجام دهد، مشخص و واضح باشید. به عنوان مثال، به جای اینکه بپرسید «در مورد این موضوع چه میدانید؟»، بپرسید «آیا میتوانید یک مرور مختصر از تاریخچه موضوع ارائه دهید؟»در صورت لزوم زمینه را ارائه دهید. اگر در مورد یک رویداد یا شخص خاص سؤالی میپرسید، اطلاعات زمینهای را ارائه دهید تا مدل بتواند زمینهای را که در آن سؤال میپرسید، درک کند.
مختصر باشد. درک پیامهای طولانی و پیچیده برای مدل دشوار است و ممکن است منجر به پاسخهای کمتر دقیق یا مرتبط شود.
از استفاده از زبان یا اصطلاحات بسیار فنی که ممکن است مدل با آن آشنا نباشد، خودداری کنید.
از پرسیدن چند سوال در یک درخواست خودداری کنید، بهتر است هر بار یک سوال بپرسید.
در اینجا چند نمونه از دستورات خوب برای ChatGPT آورده شده است:
“آیا می توانید تفاوت اصلی بین یادگیری تحت نظارت و بدون نظارت را توضیح دهید؟”اجزای اصلی یک شبکه عصبی چیست و چگونه کار می کنند؟
“لطفا یک داستان کوتاه در مورد رباتی بنویسید که می تواند ذهن ها را بخواند”
از سوی دیگر، چند نمونه از اعلانهای ضعیف عبارتند از:
“همه چیز”
“چه چیزی می توانید به من بگویید؟”
“آنچه می دانی”با پیروی از این دستورالعملها، میتوانید اطمینان حاصل کنید که هنگام استفاده از ChatGPT، دقیقترین و مرتبطترین پاسخها را از مدل دریافت میکنید.
5.2. به عنوان یک دانشمند داده به خاطر داشته باشید
ChatGPT کامل نیست. مثال ارائه شده از sklearn است. در دنیای واقعی، باید داده های خود را از منبع خود با استفاده از پانداها بارگیری کنید (مثال زیر بارگیری عنبیه را از حافظه محلی نشان می دهد).
به طور کلی، به عنوان یک دانشمند داده، شما اغلب با فرآیند چند وجهی جمع آوری داده ها، آماده سازی، ساخت مدل و تفسیر مواجه خواهید شد. این مراحل هر کدام از نظر مهارت ها و منابع نیازمندی های منحصر به فرد خود را دارند. به عنوان مثال، می توانید از پانداها برای بارگیری و دستکاری مجموعه داده های خود استفاده کنید. مهم است که به خاطر داشته باشید که نمونههای ارائه شده توسط ChatGPT به عنوان یک کمک آموزشی پایه در نظر گرفته شدهاند و ممکن است برای مدیریت مجموعه دادههای پیچیدهتر یا قابل توجهتر مناسب نباشند.
5.3. چت وحشت نکنید GPT قرار نیست جایگزین دانشمند داده شود (هنوز!)
بنابراین، بیایید از ChatGPT بپرسیم که چه فکر می کند.
دلایل متعددی وجود دارد که چرا ChatGPT و دیگر مدل های زبان بزرگ قرار نیست جایگزین دانشمندان داده شوند:
دانشمندان داده دارای مجموعه مهارت های بسیار گسترده تری هستند: دانشمندان داده در طیف گسترده ای از مهارت ها از جمله تجزیه و تحلیل داده ها، یادگیری ماشین، برنامه نویسی، آمار و موارد دیگر آموزش می بینند. ChatGPT و دیگر مدلهای زبان بزرگ فقط قادر به تولید متن بر اساس یک دستور داده شده هستند و مهارتهای دیگری که دانشمندان داده دارند را ندارند.
دانشمندان داده می توانند نتایج کار خود را تفسیر و توضیح دهند: دانشمندان داده برای تفسیر و توضیح نتایج کار خود آموزش می بینند که برای تصمیم گیری و ارتباط با ذینفعان بسیار مهم است. ChatGPT و دیگر مدل های زبان بزرگ قادر به تفسیر یا توضیح نتایج کار خود نیستند.
دانشمندان داده می توانند با طیف وسیعی از داده ها کار کنند: دانشمندان داده برای کار با طیف گسترده ای از داده ها، از جمله داده های ساختاریافته و بدون ساختار آموزش دیده اند و می توانند از ابزارها و تکنیک های مختلفی برای استخراج بینش از داده ها استفاده کنند. ChatGPT و دیگر مدلهای زبان بزرگ فقط قادر به تولید متن بر اساس یک درخواست خاص هستند و قادر به کار با انواع دیگر دادهها نیستند.
دانشمندان داده می توانند با طیف وسیعی از ذینفعان کار کنند: دانشمندان داده برای کار با طیف گسترده ای از ذینفعان، از جمله رهبران کسب و کار، کارشناسان موضوعی، و کارشناسان فنی آموزش دیده اند و می توانند مفاهیم پیچیده را به روشی واضح و قابل درک به اشتراک بگذارند. ChatGPT و دیگر مدل های زبان بزرگ قادر به کار با ذینفعان یا برقراری ارتباط مفاهیم پیچیده نیستند.
این پروژه راهنمایی دوستانه مبتدی + سایر دوره های رایگان که توسط توسعه دهندگان IBM و دانشمندان داده در https://cognitiveclass.ai/ ایجاد شده است را بررسی کنید.
تا دفعه بعد!