برنامه نویسی

مجله تجزیه و تحلیل داده های من – انجمن DEV

در هفته اول مطالعه تجزیه و تحلیل داده‌ها، «تحلیل داده چیست» را یاد گرفتم. و در زیر تعریف شده است.

تجزیه و تحلیل داده ها، تبدیل مجموعه و سازماندهی حقایق برای نتیجه گیری، پیش بینی و هدایت تصمیم گیری آگاهانه است.

کلمات کلیدی

مجموعه
تبدیل کنید
سازمان
نتیجه گیری کنید
پیش بینی کنید
تصمیم گیری آگاهانه را هدایت کنید
چیزی که شما را به یک تحلیلگر قوی داده تبدیل می کند، فقط ریاضیات نیست.

پرسیدن سوالات درست
یافتن بهترین منبع برای پاسخگویی موثر به سوال شما
یافته های خود را به وضوح در تجسم نشان می دهد
من همچنین انواع مختلف تجزیه و تحلیل کسب و کار را یاد گرفتم

4 نوع کلیدی تجزیه و تحلیل کسب و کار

تجزیه و تحلیل توصیفی: تفسیر داده های تاریخی برای شناسایی روندها و الگوها
تجزیه و تحلیل پیش بینی کننده: بر گرفتن آن اطلاعات و استفاده از آن برای پیش بینی نتایج آینده متمرکز است
تجزیه و تحلیل تشخیصی: برای شناسایی علت اصلی یک مشکل استفاده می شود
تجزیه و تحلیل تجویزی: آزمایش تکنیک های دیگر برای تعیین اینکه کدام نتایج بهترین نتیجه را در یک سناریوی معین به همراه خواهد داشت به کار می رود.
من آموختم که 6 مرحله وجود دارد که یک تحلیلگر داده برای حل یک مشکل و تصمیم گیری مبتنی بر داده ها از آن عبور می کند. این مراحل عبارتند از:

6 فاز تجزیه و تحلیل داده ها

مرحله پرسیدن: سوال بپرسید و مشکل را تعریف کنید
مرحله آماده سازی: داده های فاز با جمع آوری و ذخیره اطلاعات
مرحله فرآیند: پردازش داده ها با پاکسازی و بررسی اطلاعات
مرحله تجزیه و تحلیل: داده ها را با یافتن روابط و روندهای الگوها تجزیه و تحلیل کنید
مرحله اشتراک گذاری: داده ها را با مخاطبان خود به اشتراک بگذارید
مرحله Acts: روی داده ها عمل کنید و از نتایج تجزیه و تحلیل استفاده کنید
شما همچنین می توانید با غریزه روده خود کار کنید، اما غریزه روده شما باید بر اساس داده ها باشد در غیر این صورت از مسیر خارج خواهید شد. تجزیه و تحلیل داده ها ریشه در آمار دارد.

من در حین مطالعه چیز جالب و شگفت انگیزی دیدم که DATA ECOSYSTEMS است و آنها نیز عناصر خود را دارند.

اکوسیستم های داده عناصر مختلفی هستند که به منظور تولید، مدیریت، ذخیره، سازماندهی، تجزیه و تحلیل و به اشتراک گذاری داده ها با یکدیگر تعامل دارند، مانند ابزارهای سخت افزاری و نرم افزاری و افرادی که از آنها استفاده می کنند.

داده ها را می توان در فضای ابری نیز یافت.

ابر مکانی است که در آن داده ها به جای یک هارد کامپیوتر به صورت آنلاین نگهداری می شوند.

در حین مطالعه به عنوان تحلیلگر داده، افراد یا شما ممکن است این تصورات اشتباه رایج را داشته باشند.

علم داده با تجزیه و تحلیل داده یکسان است

علم داده با استفاده از داده ها سؤالات جدیدی ایجاد می کند. به عبارت دیگر راه‌های جدیدی برای مدل‌سازی و درک ناشناخته‌ها با استفاده از داده‌های خام ایجاد می‌کند، در حالی که تحلیلگر با ایجاد بینش از منابع داده، پاسخ‌های سؤالات موجود را می‌یابد.

تجزیه و تحلیل داده ها و تجزیه و تحلیل داده ها شبیه به هم هستند اما بسیار متفاوت هستند.

تجزیه و تحلیل داده ها جمع آوری، پردازش و تجزیه و تحلیل داده ها برای تصمیم گیری آگاهانه است در حالی که تجزیه و تحلیل داده ها علم داده است.

یکی از راه‌های قدرتمندی که می‌توانید داده‌ها را به کار ببرید، تصمیم‌گیری مبتنی بر داده‌ها با استفاده از حقایق برای هدایت استراتژی کسب‌وکار است.

اولین گام در تصمیم گیری مبتنی بر داده، پی بردن به نیازهای تجاری است که باید حل شوند.

به عنوان یک تحلیلگر، شما همچنین باید مهارت هایی (مهارت های تحلیلی) داشته باشید، این همان چیزی است که هر کسی که می خواهد یک تحلیلگر خوب یا عالی باشد، باید از آن برخوردار باشد.

مهارت‌های تحلیلی کیفیت‌ها و ویژگی‌هایی هستند که با استفاده از حقایق مرتبط با مشکل گشایی هستند.

5 نکته ضروری برای مهارت های تحلیلی

کنجکاوی
درک زمینه (شرایطی که در آن چیزی وجود دارد یا اتفاق می افتد)
داشتن ذهنیت فنی (توانایی تقسیم کردن چیزها به مراحل یا قطعات کوچکتر و کار کردن با آنها به روشی منظم و منطقی)
طراحی داده (نحوه سازماندهی اطلاعات)
استراتژی داده (مدیریت افراد، فرآیندها و ابزارهای مورد استفاده در تجزیه و تحلیل داده ها)
تفکر تحلیلی شامل شناسایی و تعریف یک مسئله و حل آن با استفاده از داده ها به صورت سازمان یافته گام به گام است. 5 مرحله تفکر تحلیلی شامل

تجسم
استراتژی (به تحلیلگر داده کمک می کند تا ببیند می خواهد با داده ها به چه چیزی برسد و چگونه می تواند به آنجا برسد. همچنین به بهبود کیفیت و سودمندی داده هایی که جمع آوری می کنیم کمک می کند)
جهت گیری مشکل (همه این است که مشکل را در ذهن خود در طول پروژه نگه دارید)
همبستگی (رابطه. مساوی علیت نیست)
تفكر معطوف به تصوير بزرگ و جزئيات (مثل نگاه كردن به كل پازل به جاي ديدن فقط قطعات كوچك است، به شما كمك مي كند بزرگ نمائيد و امكانات و فرصت ها را ببينيد)
همچنین 5 دلیل وجود دارد که می تواند به شما در یافتن راه حل یا علت اصلی یک مشکل کمک کند.

تجزیه و تحلیل شکاف روشی برای بررسی و ارزیابی نحوه عملکرد یک فرآیند در حال حاضر به منظور رسیدن به جایی که می خواهید در آینده باشید.

تصمیم گیری مبتنی بر داده با استفاده از حقایق برای هدایت استراتژی کسب و کار
مجموعه داده مجموعه‌ای از داده‌ها است که می‌توان آن‌ها را دستکاری یا تجزیه و تحلیل کرد که می‌توان آن‌ها را به عنوان یک واحد دستکاری یا تجزیه و تحلیل کرد
دلیل اصلی ایجاد مشکل
مراحل چرخه عمر داده ها

مرحله طرح: تصمیم می گیرد که چه نوع داده ای مورد نیاز است، چگونه مدیریت شود و چه کسی مسئول آن خواهد بود.
ضبط: جمع آوری یا آوردن داده ها از منابع مختلف.
مدیریت: از داده ها مراقبت و نگهداری کنید. این شامل تعیین نحوه و مکان ذخیره آن و ابزارهای مورد استفاده برای انجام این کار است.
تجزیه و تحلیل: از داده ها برای حل مشکلات برای تصمیم گیری و حمایت از اهداف تجاری استفاده کنید.
آرشیو: داده های مربوطه را برای مرجع طولانی مدت و آینده ذخیره کنید.
Destroy: داده ها را از حافظه حذف کنید و هر کپی ذخیره شده داده را حذف کنید.
برای اینکه بتوانید داده ها را جمع آوری، سازماندهی، مدیریت و پردازش کنید، به ابزارهایی نیاز دارید. به این ابزارها DATA ANALYTICAL TOOLS می گویند

این ابزارها عبارتند از

صفحه گسترده: یک صفحه کاری دیجیتال است که داده ها را ذخیره، سازماندهی و مرتب می کند. به عنوان مثال مایکروسافت اکسل و برگه های گوگل. این به شما امکان می دهد الگوها را شناسایی کنید و داده ها را به گونه ای کنار هم قرار دهید که برای هر پروژه داده خاص کار کند. آنها همچنین می توانند تجسم داده های عالی مانند نمودارها و نمودارها را ایجاد کنند.
Query: یک زبان برنامه نویسی کامپیوتری است که به شما امکان می دهد داده ها را از پایگاه داده بازیابی و دستکاری کنید. آنها به تحلیلگر اجازه انتخاب، ایجاد، اضافه کردن یا دانلود داده ها از یک پایگاه داده را برای تجزیه و تحلیل می دهند.
تجسم داده ها: آنها اعداد پیچیده را به داستانی تبدیل می کنند که مردم می توانند آن را درک کنند. آنها همچنین به ذینفعان کمک می کنند تا به نتیجه گیری هایی برسند که منجر به تصمیم گیری آگاهانه استراتژی های تجاری موثر مانند نقشه ها، نمودارها، جداول می شود.
بین فرآیند تحلیل داده ها و چرخه عمر داده ها رابطه وجود دارد.

در حالی که فرآیند تجزیه و تحلیل داده ها به شما کمک می کند تا پروژه های خود را هدایت کنید و به شما کمک می کند تا به اهداف کسب و کار خود برسید، باید چرخه عمر داده های خود را درک کنید تا از آن فرآیند استفاده کنید.

برای تجزیه و تحلیل داده های خود باید درک کاملی از آن داشته باشید. به طور مشابه شما می توانید تمام داده هایی را که می خواهید جمع آوری کنید، اما داده ها تنها در صورتی برای شما مفید هستند که برنامه ای برای تجزیه و تحلیل آن داشته باشید.

به عنوان یک تحلیلگر داده، تمرین عادلانه بسیار مهم است.

FAIRNESS این است که اطمینان حاصل شود که تجزیه و تحلیل شما سوگیری ایجاد یا تقویت نمی کند (ایجاد سیستم هایی که شامل همه باشد).

بهترین روش ها برای اطمینان از انصاف شما هستند

تمام داده های موجود را در نظر بگیرید. ما باید تصمیم بگیریم که چه داده هایی مفید هستند. اغلب داده‌هایی وجود دارد که به چیزی که روی آن تمرکز کرده‌اید مربوط نمی‌شود یا به نظر نمی‌رسد با خواسته‌های شما همخوانی داشته باشد. اما شما نمی توانید آن را نادیده بگیرید. بسیار مهم است که تمام داده های موجود را در نظر بگیرید تا تجزیه و تحلیل شما منعکس کننده حقیقت باشد و نه فقط انتظارات شما.
شناسایی عوامل اطراف متن برای شما و ذینفعان کلیدی است تا نتیجه‌گیری نهایی هر تحلیلی را درک کنید. همچنین باید تمام داده ها را در نظر بگیرید تا بینش بیشتری داشته باشید.
شامل داده های خود گزارش دهی شود. این یک تکنیک جمع آوری داده است که در آن شرکت کنندگان اطلاعاتی در مورد خود ارائه می دهند. این یک راه عالی است که انصاف را در فرآیند جمع آوری خود وارد کنید. مردم برای مشاهدات خود در مورد جهان، از جمله در مورد سایر افراد، تعصب آگاهانه و ناخودآگاه ایجاد می کنند. این روش می تواند به شما کمک کند تا از این سوگیری ناظر جلوگیری کنید.
از نمونه برداری بیش از حد به طور موثر استفاده کنید. این فرآیند افزایش حجم نمونه گروه های غیر غالب در یک جمعیت است. این می تواند به شما کمک کند آنها را بهتر نشان دهید و مجموعه داده های عدم تعادل را برطرف کنید.
از ابتدا تا انتها به انصاف فکر کنید.
برخی از سؤالات مؤثرتر از سؤالات دیگر هستند. یک سوال بله یا خیر یک سوال بسته است و نمی تواند به بینش ارزشمندی منجر شود.

سوالات موثر از روش SMART پیروی می کنند

-خاص: اگر سوال خیلی کلی است سعی کنید آن را با تمرکز بر یک عنصر محدود کنید. اما نباید یک سوال بسته باشد.

-قابل اندازه گیری: بگذارید سوالات ما قابل اندازه گیری باشد. مانند استفاده از ارقام، مقادیر و غیره

-عمل‌محور: اجازه دهید سؤالات ما تغییر را تشویق کنند

-مرتبط: وقتی سؤالات مرتبطی می‌پرسید، می‌تواند به شما در حل مشکلی که می‌خواهید حل کنید کمک کند.

زمان محدود: باید زمان مورد مطالعه را مشخص کند که دامنه تمرکز تحلیلگر داده بر داده های مربوطه را محدود می کند.

ما باید سؤالات منصفانه بپرسیم (fairnes) به این معنی که در سؤالات ما نباید هیچ گونه سوگیری وجود داشته باشد، به عنوان مثال سؤالات شما را به سمت یک راه معین هدایت کنید و فرضیاتی ایجاد کنید.

برخی از سوالاتی که ممکن است هنگام ارائه پروژه بپرسید

⭕هدف: اهداف سوال چیست؟ انتظار می رود به چه سوالاتی پاسخ داده شود؟

⭕ حضار: سهامداران چه کسانی هستند؟ چه کسی در مورد نتایج دیپ دیو علاقه مند یا نگران است؟ مخاطبان شیرجه عمیق چه کسانی هستند؟

⭕ TIME: بازه زمانی تکمیل چیست؟ تا چه تاریخی باید این کار انجام شود؟

⭕ منابع: چه منابعی برای انجام غواصی عمیق در دسترس است؟

⭕ امنیت: چه کسی باید به اطلاعات دسترسی داشته باشد.

من در مورد چگونگی قدرت بخشیدن به تصمیمات داده ها یاد گرفتم. دو نوع تصمیم گیری داده عبارتند از:

تصمیم گیری الهام گرفته از داده که منابع داده های مختلف را بررسی می کند تا وجوه مشترک آنها را پیدا کند.
تصمیم گیری مبتنی بر داده که از حقایق برای هدایت استراتژی های تجاری استفاده می کند.

همچنین در مورد دو نوع داده یاد گرفتم که ممکن است به ما در پاسخ به سؤالات مختلف کمک کند. آنها عبارتند از؛

1) داده های کمی که با اندازه گیری حقایق عددی سروکار دارند و سوالاتی مانند چه؟، چند؟، چند بار؟
2) داده های کیفی که با معیارهای توضیحی سروکار دارند و سؤالاتی مانند چرا؟

همچنین 2 نوع ابزار ارائه داده وجود دارد که عبارتند از:
-گزارش ها: که مجموعه ای ثابت از داده ها هستند که به صورت دوره ای به ذینفعان داده می شود
داشبوردها: که داده های دریافتی زندگی را نظارت می کند.

3 نوع رایج داشبورد
ط) داشبوردهای استراتژیک بر اهداف و استراتژی بلند مدت تمرکز دارند
بالاترین سطح نگهداری

ii) داشبورد عملیاتی که بر عملکرد کوتاه مدت تمرکز دارد
ردیابی و اهداف میانی

iii) داشبورد تحلیلی که از مجموعه داده ها و ریاضیات تشکیل شده است
در این مجموعه استفاده شده است.

یاد گرفتم که داده ها می توانند بزرگ یا کوچک باشند

SMALL DATA مجموعه ای از نقاط داده کوچک خاص است که معمولاً شامل یک دوره زمانی کوتاه است که در تصمیم گیری روزانه مفید است.

-BIG DATA یک مجموعه داده پیچیده بزرگ است که معمولاً شامل دوره های طولانی مدت است که به تحلیلگر داده امکان می دهد تا به الگوهای تجاری گسترده رسیدگی کند.

به عنوان فردی که در مدرسه ICT مطالعه کرده است، قطعاً در مورد صفحات گسترده می دانم، اما بیشتر مایکروسافت اکسل را دیده ام.

اخیراً قبل از شروع سفر تجزیه و تحلیل داده‌هایم، بیشتر در مورد microsoft excel و همه فرمول‌ها و عملکردهای آن مطالعه کردم و این برای من تجربه زیبایی بود که مجبور بودم با فرمول‌ها و توابع جدیدی که قبلاً ندیده‌ام و مجبور بودم کارهای زیادی را کاوش کنم و انجام دهم. با مایکروسافت اکسل،

امروز من در مورد نحوه استفاده از صفحات گسترده (میکروسافت اکسل و صفحات گوگل) برای تجزیه و تحلیل داده ها و نحوه ارتباط آن با چرخه عمر داده ها که شامل موارد زیر است یاد گرفتم:
➡️ برنامه ریزی کنید
➡️ گرفتن
➡️ مدیریت کنید
➡️ تجزیه و تحلیل
➡️ آرشیو
➡️ نابود کنید

— — PLAN به معنای قالب بندی سلول های خود، سرفصل هایی که برای برجسته کردن انتخاب می کنید، طرح رنگ و نحوه ترتیب دادن نقاط داده خود است.

– ضبط داده ها توسط منبع با اتصال صفحات گسترده به منابع داده دیگر مانند برنامه کاربردی نظرسنجی آنلاین یا پایگاه داده

– انواع مختلف داده ها را با یک صفحه گسترده مدیریت کنید. این می تواند شامل ذخیره سازی، سازماندهی، فیلتر کردن و به روز رسانی اطلاعات باشد. آنها همچنین می توانند به شما اجازه دهند که بدانید چه کسی می تواند به داده ها دسترسی داشته باشد.

– تجزیه و تحلیل داده ها در یک صفحه گسترده برای کمک به تصمیم گیری بهتر. برخی از رایج ترین ابزارهای صفحه گسترده شامل فرمول ها و جداول محوری هستند.

– -بایگانی کردن صفحه‌گسترده‌ای که اغلب از آن استفاده نمی‌کنید، اما ممکن است بعداً نیاز به ارجاع با ابزارهای داخلی داشته باشید.

– وقتی مطمئن هستید که دیگر به آن نیاز نخواهید داشت، صفحه گسترده خود را نابود کنید. اگر از آن استفاده می کنید، بهتر است نسخه های پشتیبان یا برای امنیت قانونی داشته باشید.

⭕ OPERATOR نمادی است که نوع عملیات یا محاسباتی که باید انجام شود را نام می‌برد.
⭕ CELL REFERENCE یک سلول یا محدوده ای از سلول ها در یک کاربرگ است که می تواند در فرمول استفاده شود.
⭕ RANGE مجموعه ای از 2 یا چند سلول است.

من یاد گرفتم که حتی به عنوان یک تحلیلگر داده با تجربه، برخی از خطاهای رایج در هنگام انجام عملیات وجود دارد. این خطاها شامل

1) خطای DIV
2) خطای DN
3) غیر مجاز
4) ERROR

من از فرمول های اکسل برای محاسبه داده ها استفاده کردم. من از فرمول های پایه مانند SUM، AVERAGE، MIN، MAX، DIVIDE، MULTIPLY و غیره در میان فرمول های بسیاری که وجود دارد استفاده کردم.

من همچنین در مورد تفکر یاد گرفتم که فرآیند شناخت مشکل یا موقعیت فعلی، سازماندهی اطلاعات موجود، آشکار کردن شکاف ها و فرصت ها و شناسایی گزینه ها است.

یکی از راه هایی که می توانید تفکر ساختاریافته و اجتناب از اشتباهات را تمرین کنید این است
با استفاده از SCOPE O WORK.

⭕ SCOPE OF WORK (SOW) طرح کلی کاری است که قرار است روی یک پروژه انجام دهید، به عنوان مثال جزئیات کار، گزارش ها، برنامه هایی که مشتری می تواند ارائه دهد. تحت این ما داریم:

➡️ تحویلی که بر روی چه کارهایی در حال انجام است و چه چیزهایی در نتیجه این پروژه ایجاد می شود تمرکز دارد؟
➡️ نقطه عطف که ارتباط نزدیکی با جدول زمانی شما دارد. نقاط عطف اصلی در پروژه شما چیست؟ چگونه متوجه می شوید که بخشی از پروژه شما کامل شده است؟
➡️ TIMELINE که به نقطه عطفی که برای پروژه خود ایجاد کرده اید نزدیک است. جدول زمانی راهی است برای ترسیم انتظارات برای مدت زمانی که هر مرحله از فرآیند باید طول بکشد.
➡️ گزارش هایی که باید وضعیت را به ذینفعان خود به روز کنید. هفتگی خواهد بود یا ماهانه؟

ذینفعان مختلفی که ممکن است در حین کار بر روی یک پروژه با آنها روبرو شویم. آنها عبارتند از:

➡️ تیم اجرایی که راهبردی و عملیاتی را ارائه می کنند
رهبری به شرکت آنها از معاونان رئیس جمهور، رئیس ساخته شده اند
افسر بازاریابی، و حرفه ای های سطوح ارشد.
➡️ تیم مشتری مدار. هر کس در یک سازمان که برخی از آنها را دارد
سطوح تعامل با مشتریان و مشتریان بالقوه
➡️تیم علم داده. سازماندهی داده ها در یک شرکت مستلزم کار تیمی است.
شانس خوبی وجود دارد که با داده های دیگر کار کنید
تحلیلگر، دانشمند داده و مهندسان داده.

من آموخته ام که کار موثر با ذینفعان اغلب باید فراتر از داده ها بروید و برای انجام این کار به نکات زیر برای برقراری ارتباط واضح، ایجاد اعتماد و ارائه یافته های خود در بین گروه ها نیاز داریم.
‼️ درباره اهداف بحث کنید
‼️برای نه گفتن احساس قدرت کنید
‼️ برای موارد غیر منتظره برنامه ریزی کنید
‼️پروژه خود را بشناسید
‼️با کلمات و تصاویر شروع کنید
‼️ اغلب ارتباط برقرار کنید.

ارتباط شفاف کلیدی است. قبل از برقراری ارتباط فکر کنید
– مخاطبان هدف شما چه کسانی هستند
-آنچه آنها قبلاً می دانند
-آنچه آنها باید بدانند
– هر چند وقت یکبار می توانید آن را به طور مؤثر با آنها در میان بگذارید

در مطالعات امروزی آموختم که مهارت‌های خوب نوشتن، شنیدن و صحبت کردن نیز می‌تواند به شما به عنوان یک تحلیلگر داده کمک کند. این به این دلیل است که سرعت می تواند دشمن دقت باشد.

به همین دلیل است که ارتباطات ارزشمندترین ابزار برای کار با تیم است. بنابراین مهم است که با تفکر ساختاریافته و یک محدوده کار (SOW) به خوبی برنامه ریزی شده شروع کنید.

همچنین یاد گرفتم که داده ها می توانند محدودیت هایی داشته باشند. به عنوان یک تحلیلگر داده مهم است که محدودیت های داده را بدانید تا بتوانید برای آن آماده شوید. محدودیت های داده ها به شرح زیر است

⭕ داده ناقص یا وجود ندارد.
⭕داده های نادرست را از دست ندهید
⭕ مقابله با کثیف (تمیز کردن داده ها)
⭕ یک داده واضح بگویید.

💠 همین نوع داده ها را مقایسه کنید
💠 داده های هوش را تجسم کنید
💠 نمودارهای سوزنی را کنار بگذارید
💠 آزمون معنی دار بودن آماری
💠 به حجم نمونه توجه کنید

⭕ قاضی باشید

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا