خانه / علم داده / ابزارهای هوش تجاری / تحلیل جام جهانی ۲۰۱۴ برزیل با Power BI – بخش اول
Fifa2014_1

تحلیل جام جهانی ۲۰۱۴ برزیل با Power BI – بخش اول

مقدمه

یکی از ابزاری که جای خالی آن در ادارات و سازمانها، احساس می شود نرم افزارهای هوش تجاری و تحلیل داده است. امروزه، داده در تمامی ارکان سازمان ها و ادارات در حال تولید و ذخیره سازی است اما تحلیل و استفاده حرفه ای از آنها هنوز نهادینه نشده است .

یک دلیل آنرا عدم وجود کارشناسان تحلیل داده در ایران می توان دانست و دلیل دوم هم عدم آشنایی مدیران و کارشناسان فناوری اطلاعات با ابزار و تکنیکهای هوش تجاری است .

وب سایت مهندسی داده، در جهت رواج مباحث تحلیل و پردازش داده، سلسله آموزشهایی را به طور خاص در زمینه ابزارهای رایج تحلیل داده و هوش تجاری به تدریج منتشر خواهد کرد و نرم افزارهایی مانند Tableau ، QLik، Pentaho ، Talent و Power BI از جمله نرم افزارهاییست که به آموزش آنها خواهیم پرداخت.

Power BI Desktop

مایکروسافت در ادامه سیاست تولید ابزارهای ذخیره و تحلیل داده که اکثراً مبتنی بر SQL Server هستند و اخیرا هم سرویس های رایانش ابری Azure و سرمایه گذاری روی زبان تحلیل داده R‌ هم به آنها اضافه شده است، نرم افزار رومیزی و خانگی Power BI را که به طور خاص به عنوان یک ابزار دم دستی هوش تجاری محسوب میشود، روانه بازار کرده است .

در این مقاله با استفاده از مقاله آموزشی آقای رضا راد که یکی از افراد فعال در حوزه ابزارهای تحلیل داده مایکروسافت است، با امکانات این نرم افزار ساده و کاربردی در قالب تحلیل بازی های فوتبال انجام شده در جام جهانی ۲۰۱۴ برزیل،آشنا خواهید شد.

برای شروع کار نرم افزار Power BI را از این آدرس دانلود کنید :

https://powerbi.microsoft.com/desktop

استخراج و دریافت داده ها

برای بررسی و تحلیل داده های جام جهانی ۲۰۱۴ برزیل، از آمار موجود در سایت فیفا استفاده خواهیم کرد.

گل ها و امتیازات هر تیم

آمار گلهای رد و بدل شده به همراه امتیاز هر تیم را در این آدرس می توانید بیابید :

http://www.fifa.com/worldcup/archive/brazil2014/statistics/teams/goal-scored.html

Fifa2014_2

برای ورود این داده ها در Power BI‌ این مراحل را به ترتیب زیر انجام دهید :

  • نرم افزار Power BI را باز کنید .
  • گزینه Get Data را انتخاب کنید.
  • در پنجره Get Data زیر قسمت Other روی گزینه Web کلیک کنید.

Fifa2014_3

  • در پنجره From Web آدرس بالا را وارد کنید و گزینه OK را بزنید .
  • یک پنجره پیمایش (Navigator) ظاهر می شود (شکل زیر)، روی جدولی که حاوی اطلاعات موردنظر است ، در سمت چپ کلیک کنید تا به حالت انتخاب درآید و گزینه ویرایش را بزنید تا پنجره ویرایشگر پرس و جو (Query Editor) باز شود

Fifa2014_5

  • ویرایشگر پرس و جو، به همراه داده های جدول، بارگزاری شده و در پنجره اصلی نمایش داده می شود :

 

Fifa2014_6

توضیح : ویرایشگر پرس و جو با نام Power Query Editor نیز نامیده می شود، به شما امکان تبدیل و بارگذاری داده ها را به گونه ای که Power BI بتواند از آنها استفاده کند، می دهد. در این پنجره بخشهای (پنجرک) زیر قابل مشاهده اند :

  1. پنجرک اصلی  یا Main Pane یک پیش نمایش از داده ها و تبدیلات صورت گرفته روی آنها نمایش می دهد.
  2. پنجرک پرس و جو یا Query Pane که تمام پرس و جوهای به کار رفته را فهرست می کند.
  3. پنجرک تنظیمات (Query Setting) که مراحل پیش پردازش داده ها را نشان میدهد با قابلیت ویرایش و حذف هر مرحله .
  4. پنجرک تبدیلات یا Transformation  که فهرستی از انواع تبدیلات مورد نیاز برای داده ها را نمایش می دهد و می توانید از بین آنها یکی را انتخاب و اعمال کنید .

مجموعه داده گل ها تقریبا آماده استفاده است .تنها تغییری که نیاز دارد، حذف دو کاراکتر انتهایی در نام ستون هاست که به دلیل وجود آیکون در جدول اصلی سایت فیفا به وجود آمده است و باید حذف شود. روی هر سر ستون (خانه اول ستون) کلیک راست کرده و گزینه Rename Column را انتخاب کنید و دو کاراکتر انتهایی هر ستون را پاک کنید.

Fifa_2014_7

در آخرین مرحله هم نام پرس و جو را به TeamGoals تغییر دهید (در بخش تنظیمات پرس و جو) .

اکنون داده ها باید به صورت زیر درآمده باشد :

Fifa_2014_8

پاس های تیم ها

مرحله بعدی،‌وارد کردن اطلاعات پاس های رد و بدل شده توسط تیم های جام جهانی ۲۰۱۴ است. مشابه مرحله قبل، داده ها را از آدرس زیر باید بازیابی کنیم.

http://www.fifa.com/worldcup/archive/brazil2014/statistics/teams/passes.html

مراحل زیر را انجام دهید :

  • بدون بستن پنجره ویرایشگر پرس و جو، از منوی اصلی، منوی Home ،گزینه New Query را بزنید و سپس گزینه New Source و مقدار Choose from web را انتخاب کرده و در پنجره باز شده، آدرس فوق را وارد کنید و دکمه OK را بزنید.
  • در پنجره پیمایش، جدول مورد نظر(Table 0) را انتخاب کرده و گزینه OK را بزنید.

Fifa_2014_9

  • اکنون باید داده ها را در ویرایشگر پرس و جو مشاهده کنید.
  • مشابه داده های قبلی، دو کاراکتر انتهایی نام ستون ها را حذف کنید .
  • نام ستون Team2  را به Teams Abrv تغییر دهید.
  • برای نام ستون هایی که درصد را نشان می دهند، عدد ۲ را از انتهای آنها حذف کنید و کلمه Percentage را به انتهای آنها اضافه کنید .

در بعضی از ستون ها، مقادیر به صورت درصد همراه با کاراکتر % نمایش داده می شود که وجود این کاراکتر باعث می شود با آن ستون، به عنوان یک داده متنی رفتار شود که مطلوب ما نیست چون توابع مختلف ریاضی و آماری روی داده های متنی قابل استفاده نیستند. بنابراین باید علامت درصد را حذف کنیم و نوع داده آن ستون ها را هم به عددی تغییر دهیم و مقادیر آنها را هم بعد از حذف کاراکتر درصد به مقدار اعشاری متناظرشان تبدیل کنیم (هر عدد را بر صد باید تقسیم کنیم ). برای انجام این کارها، مراحل زیر را طی کنید :

  • روی ستون Passes Completed Percentage کلیک راست کرده، گرینه Replace values را بزنید.

Fifa_2014_10

  • کاراکتر ٪ را با رشته خالی مشابه شکل زیر جایگزین کنید :

Fifa_2014_11

  • بعد از انجام مرحله فوق، مشاهده می کنید که علامت ٪ حذف شده است، حالا نوع داده این ستون را به اعداد دهدهی (Decimal) تغییر دهید. (مطابق شکل)

Fifa_2014_12

  • در مرحله بعد، این اعداد را باید به اعداد اعشاری متناظر با درصد آنها تبدیل کنیم یعنی آنها را بر صد تقسیم کنیم . برای اینکار روی ستون Passes Completed Percentage کلیک کنید که در حالت انتخاب قرار بگیرد و بعد از منوی تبدیلات یا Transform بخش Number ، زیر منوی استاندارد، گزینه تقسیم Divide را انتخاب کنید .

Fifa_2014_10

  • مقدار صد را وارد کنید و گزینه OK را بزنید.
  • همین مراحل را برای ستون Crosses Completed Percentage column (تغییر نام یافته Crosses Completed 2 ) هم انجام دهید.
  • پرس و جو را به TeamPasses تغییر نام دهید. نتیجه باید شبیه زیر باشد :

Fifa_2014_10

 دفاع تیم ها

آخرین مجموعه داده ای که برای تحلیل تیم ها اضافه خواهیم کرد، داده های مربوط به دفاع تیم هاست که اطلاعات آن در آدرس زیر قابل دسترسی است :

http://www.fifa.com/worldcup/archive/brazil2014/statistics/teams/defending.html

دقیقاً مشابه مرحله قبل که برای پاس ها انجام داده بودیم،‌مراحل را انجام دهید : تصحیح نام ستون ها، حذف درصد و تغییر نوع آن و نهایتاً تبدیل به اعشار اعداد درصدی.

خروجی باید شبیه زیر باشد :

Fifa_2014_10

مدلسازی داده ها

مجموعه داده های دیگری هم می توان از سایت فیفا برای جام جهانی ۲۰۱۴ دانلود کرد اما برای این آموزش ، همین سه تا کافیست .

در این مرحله، ارتباط بین داده ها را برقرار خواهیم کرد و مدلسازی داده های مورد نیاز بخش تحلیل را نهایی می کنیم .

از ویرایشگر پرس و جو با زدن دکمه Close & Load که زیر منوی Home و بخش Close‌ قرار گرفته است، خارج می شویم.

Fifa_2014_10

زبانه ارتباط داده ها

 سمت چپ نرم افزار، روی زبانه Relationships کلیک کنید و خواهید دید که زبانه ارتباط داده ها باز شده و به طور خودکار هم ارتباط بین سه جدول فوق برقرار شده است.  این ارتباط البته بر اساس نام های مشابه بین دو جدول ایجاد شده است .

Fifa_2014_10

می توانید در صورت نیاز این روابط را تغییر دهید .

Fifa_2014_10

برای این مثال ، ما روابط را درهمین حدی که هست نگه میداریم.

زبانه داده ها

در زبانه داده ها، می توانید مجموعه داده ها را مشاهده کنید، شکل نمایش ستون ها را تغییر دهید (عمل قالب بندی)، یا یک سنجه (Measure) جدید به داده ها اضافه کنید . تصاویر زیر نحوه دستیابی به زبانه داده ها را از بخش چپ محیط Power BI به شما نشان میدهد.

توضیح : منظور از سنجه ، یک خصوصیت جدید است برای داده هاست مثلاً اگر ما ستون سال تولد را داشته باشیم ، می توانیم سنجه ای به نام سن اضافه کنیم که حاصل تفریق سالجاری از سال تولد هر شخص باشد.

Fifa_2014_10

در قسمت فوقانی شکل بالا هم می توانید منوی مدلسازی داده ها را ببینید که به شما اجازه ساخت و ویرایش سنجه ها و قالب بندی آنها را می دهد. روابط بین داده ها هم از این بخش قابل دستیابی است .

نحوه نمایش ستون های درصد را به کمک این زبانه می خواهیم از حالت عددی به حالت درصدی تبدیل کنیم. مراحل زیر را انجام میدهیم :

  • در پنجرک Fields که سمت راست نرم افزار قرار گرفته، روی TeamPasses کلیک کنید .
  • با نمایش داده ها روی ستون Passes Completed Percentage کلیک کرده، از بخش قالب بندی (Formatting) که درون منوی مدلسازی (Modeling) قرار گرفته، گزینه درصد را انتخاب کنید .

Fifa_2014_10

  • این عمل را برای تمام ستون های  درصدی دو جدول TeamPasses  و TeamDefending هم انجام دهید.

اکنون داده های ما برای گزارش گیری آماده شده اند.

در بخش بعدی به نحوه گزارش گیری و استفاده از داده ها خواهیم پرداخت….

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Time limit is exhausted. Please reload CAPTCHA.