همه دسته بندی ها
تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

نحوه تجمیع داده‌ ها در Tableau

نحوه تجمیع داده‌ ها (Data Aggregation) در تبلو

در Tableau، می‌توانید معیارها (Measures) یا ابعاد (Dimensions) را تجمیع کنید، اگرچه تجمیع معیارها رایج‌تر است. هر زمان که یک معیار به نمای خود اضافه می‌کنید، به طور پیش‌فرض یک Aggregation برای آن معیار اعمال می‌شود. نوع تجمیع اعمال شده بسته به زمینه نما متفاوت است.

تغییر تجمیع (Aggregation) یک معیار در View

وقتی یک Measure را به view اضافه می‌کنید، Tableau به طور خودکار مقادیر آن را Aggregation می‌کند. مجموع، میانگین و میانه تجمیع‌های رایج هستند؛ برای لیست کامل، به لیست تجمیع‌های از پیش تعریف شده در Tableau مراجعه کنید.

تجمیع فعلی به عنوان بخشی از نام معیار در نما ظاهر می‌شود. به عنوان مثال، Sales به SUM(Sales) تبدیل می‌شود. هر معیار یک Aggregation پیش‌فرض دارد که هنگام اتصال به یک منبع داده توسط Tableau تنظیم می‌شود. می‌توانید تجمیع پیش‌فرض را برای یک معیار مشاهده یا تغییر دهید.

شما می‌توانید Measureها را با استفاده از Tableau فقط برای منابع داده رابطه‌ای تجمیع کنید. منابع داده چندبعدی حاوی داده‌هایی هستند که از قبل Aggregation شده‌اند. در Tableau، منابع داده چندبعدی فقط در ویندوز پشتیبانی می‌شوند.

برای خرید لایسنس تبلو کلیک کنید

شما می‌توانید Aggregation یک معیار را در نما از منوی زمینه آن تغییر دهید:

تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

تجمیع ابعاد (Aggregating Dimensions)

شما می‌توانید یک بُعد (dimension) را در نما به صورت حداقل، حداکثر، تعداد یا تعداد (متمایز) Aggregation کنید. وقتی یک بُعد را تجمیع می‌کنید، یک ستون اندازه‌گیری موقت جدید ایجاد می‌کنید، بنابراین بُعد در واقع ویژگی‌های یک معیار را به خود می‌گیرد.

تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

راه دیگر برای مشاهده یک بُعد، در نظر گرفتن آن به عنوان یک ویژگی (Attribute) با انتخاب ویژگی (Attribute) از منوی زمینه برای بُعد است. تجمیع ویژگی (Attribute ؤggregation) کاربردهای مختلفی دارد:

  • این تجمیع می‌تواند سطح ثابتی از جزئیات (LOD) را هنگام ترکیب چندین منبع داده تضمین کند.
  • این تجمیع می‌تواند راهی برای تجمیع ابعاد هنگام محاسبه محاسبات جدول (table calculations)، که نیاز به یک عبارت تجمیعی (aggregate expression) دارند، فراهم کند.
  • این تجمیع می‌تواند عملکرد پرس‌وجو را بهبود بخشد زیرا محاسبه می‌شود.

Tableau ویژگی را با استفاده از فرمول زیر محاسبه می‌کند:

IF MIN([dimension]) = MAX([dimension]) THEN MIN([dimension]) ELSE “*” END

این فرمول پس از بازیابی داده‌ها از پرس‌وجوی اولیه در Tableau محاسبه می‌شود. ستاره (*) در واقع یک نشانگر بصری از نوع خاصی از مقدار Null است که وقتی چندین مقدار وجود دارد، رخ می‌دهد.

در اینجا مثالی از استفاده از ویژگی در محاسبه جدول آورده شده است. جدول، فروش را بر اساس بازار، اندازه بازار و ایالت نشان می‌دهد. فرض کنید می‌خواهید درصد کل فروش هر ایالت در بازار را محاسبه کنید. وقتی یک محاسبه سریع درصد از کل را به جدول اضافه می‌کنید که در امتداد ایالت محاسبه می‌شود، محاسبه در ناحیه قرمز انجام می‌شود. دلیل این امر این است که بُعد اندازه بازار، داده‌ها را تقسیم‌بندی می‌کند.

تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

وقتی اندازه بازار را به عنوان یک ویژگی جمع می‌کنید، محاسبه در داخل بازار (شرق، در تصویر زیر) انجام می‌شود و اندازه بازار صرفاً به عنوان یک برچسب در نظر گرفته می‌شود.

تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

 

فهرست تجمیع‌های از پیش تعریف‌شده در Tableau

گاهی اوقات بررسی داده‌های عددی به صورت تجمیع‌شده مانند مجموع یا میانگین مفید است. توابع ریاضی که داده‌های تجمیع‌شده تولید می‌کنند، توابع تجمیع (Aggregation Functions) نامیده می‌شوند. توابع Aggregation، محاسبه‌ای را روی مجموعه‌ای از مقادیر انجام می‌دهند و یک مقدار واحد را برمی‌گردانند. به عنوان مثال، معیاری که شامل مقادیر ۱، ۲، ۳، ۳، ۴ است که به صورت مجموع تجمیع شده‌اند، یک مقدار واحد را برمی‌گرداند: ۱۳. یا اگر ۳۰۰۰ تراکنش فروش از ۵۰ محصول دارید، ممکن است بخواهید مجموع فروش هر محصول را مشاهده کنید تا مشخص شود کدام محصولات بیشترین درآمد را دارند.

توجه: استفاده از مقادیر اعشاری با تجمیع، گاهی اوقات می‌تواند منجر به نتایج غیرمنتظره‌ای شود.

Tableau مجموعه‌ای از تجمیع‌های از پیش تعریف‌شده را ارائه می‌دهد که در جدول نشان داده شده‌اند. شما می‌توانید Aggregation پیش‌فرض را برای هر معیاری که یک فیلد محاسبه‌شده نیست و خود شامل یک تجمیع است، مانند AVG([Discount]) تنظیم کنید.

تجمیع شرح نتیجه برای معیاری که شامل ۱، ۲، ۲، ۳ است
Attribute اگر عبارت داده شده فقط یک مقدار برای همه ردیف‌های گروه داشته باشد، مقدار آن را برمی‌گرداند، در غیر این صورت یک کاراکتر ستاره (*) نمایش می‌دهد. مقادیر Null نادیده گرفته می‌شوند. این Aggregation هنگام تجمیع یک بُعد مفید است. برای تنظیم یک معیار در view به این تجمیع، روی معیار کلیک راست (در مک، کنترل-کلیک) کرده و Attribute را انتخاب کنید. سپس فیلد تغییر می‌کند تا متن ATTR را نشان دهد:

Attribute of sales pill.

*
Dimension تمام مقادیر منحصر به فرد را در یک معیار یا بُعد برمی‌گرداند. ۳ مقدار (۱، ۲، ۳)
Sum مجموع اعداد موجود در یک معیار را برمی‌گرداند. مقادیر Null نادیده گرفته می‌شوند. ۱ مقدار (۸)
Average میانگین حسابی اعداد را در یک معیار برمی‌گرداند. مقادیر Null نادیده گرفته می‌شوند. ۱ مقدار (۲)
Count (Distinct) تعداد مقادیر منحصر به فرد در یک معیار یا بُعد را برمی‌گرداند. وقتی این تابع روی یک بُعد اعمال می‌شود، Tableau یک ستون موقت جدید ایجاد می‌کند که یک معیار است زیرا نتیجه شمارش یک عدد است. می‌توانید اعداد، تاریخ‌ها، مقادیر بولی و رشته‌ها را بشمارید. مقادیر تهی در همه موارد نادیده گرفته می‌شوند.

این Aggregation برای انواع زیر از کتاب‌های کاری در دسترس نیست:

  • Workbookهای که قبل از Tableau Desktop 8.2 ایجاد شده‌اند و از منابع داده Microsoft Excel یا Text File استفاده می‌کنند.
  • Workbookهای که از اتصالات قدیمی استفاده می‌کنند.
  • Workbookهای که از منابع داده Microsoft Access استفاده می‌کنند.

اگر به Workbook متصل هستید که از یکی از این انواع استفاده می‌کند، Count (Distinct) در دسترس نیست و Tableau پیام “Requires extract” یعنی نیاز به استخراج را نشان می‌دهد. برای استفاده از این تجمیع، داده‌های خود را استخراج کنید.

۱ مقدار (۳)
Minimum کوچکترین عدد را در یک معیار یا بُعد پیوسته برمی‌گرداند. مقادیر Null نادیده گرفته می‌شوند. ۱ مقدار (۱)
Maximum بزرگترین عدد را در یک معیار یا در عبارت داده شده بر اساس یک جمعیت نمونه برمی‌گرداند. مقادیر Null نادیده گرفته می‌شوند. اگر کمتر از ۲ عضو در نمونه وجود داشته باشد که Null نباشند، تهی را برمی‌گرداند. اگر داده‌های شما نشان دهنده نمونه‌ای از جمعیت است، از این تابع استفاده کنید. ۱ مقدار (۳)
Std. Dev (Pop.) انحراف استانداردها تمام مقادیر موجود در عبارت داده شده را بر اساس یک جمعیت بایاس شده برمی‌گرداند. فرض می‌کند که آرگومان‌های آن شامل کل جمعیت است. از این تابع برای اندازه‌های نمونه بزرگ استفاده کنید. ۱ مقدار (۰.۷۰۷۱)
Variance واریانس تمام مقادیر موجود در عبارت داده شده را بر اساس یک نمونه برمی‌گرداند. مقادیر Null نادیده گرفته می‌شوند. اگر کمتر از ۲ عضو در نمونه وجود داشته باشد که تهی نباشند، Null را برمی‌گرداند. اگر داده‌های شما نشان‌دهنده نمونه‌ای از جمعیت است، از این تابع استفاده کنید. ۱ مقدار (۰.۶۶۶۷)
Variance (Pop.) واریانس تمام مقادیر در عبارت داده شده را بر اساس یک جمعیت بایاس شده برمی‌گرداند. فرض می‌کند که آرگومان‌های آن شامل کل جمعیت است. از این تابع برای اندازه‌های نمونه بزرگ استفاده کنید. ۱ مقدار (۰.۵۰۰۰)
Disaggregate تمام رکوردهای موجود در منبع داده‌ی اصلی را برمی‌گرداند. برای تفکیک تمام معیارها در view، از منوی Analysis گزینه‌ی Aggregate Measures را انتخاب کنید (تا علامت تیک برداشته شود).

Tableau به شما امکان می‌دهد داده‌ها را به صورت تفکیک‌شده (فقط پایگاه‌های داده رابطه‌ای) مشاهده کنید. وقتی داده‌ها تفکیک می‌شوند، می‌توانید ردیف‌های جداگانه منبع داده خود را مشاهده کنید. به عنوان مثال، پس از اینکه متوجه شدید مجموع فروش کش‌های لاستیکی ۱۴۶۰۰ دلار است، ممکن است بخواهید توزیع تراکنش‌های فروش جداگانه را ببینید. برای پاسخ به این سوال، باید نمایی ایجاد کنید که ردیف‌های جداگانه داده‌ها را نشان دهد. یعنی، باید داده‌ها را تفکیک کنید. راه دیگر برای مشاهده داده‌های تفکیک‌شده، مشاهده داده‌های زیربنایی برای تمام یا بخشی از یک نما است.

 

همچنین می‌توانید تجمیع‌های سفارشی را همانطور که در توابع تجمیع (Aggregation Functions) توضیح داده شده است (لینک در یک پنجره جدید باز می‌شود) تعریف کنید. بسته به نوع نمای داده‌ای که ایجاد می‌کنید، Tableau این تجمیع‌ها را در سطح مناسبی از جزئیات اعمال می‌کند. به عنوان مثال، Tableau تجمیع را برای اعضای هر بُعد (میانگین زمان تحویل در منطقه شرق)، همه اعضا در یک بُعد معین (میانگین زمان تحویل در مناطق شرق، غرب و مرکزی) یا گروه‌هایی از ابعاد (مجموع فروش برای همه مناطق و برای همه بازارها) اعمال می‌کند.

تنظیم Aggregation پیش‌فرض برای یک معیار

می‌توانید تجمیع پیش‌فرض را برای هر معیاری که یک فیلد محاسبه‌شده نیست و خود شامل یک تجمیع است، مانند AVG([Discount])، تنظیم کنید. تجمیع پیش‌فرض، محاسبه‌ای ترجیحی برای خلاصه کردن یک فیلد پیوسته یا گسسته است. Aggregation پیش‌فرض به طور خودکار هنگام کشیدن یک معیار به یک نما استفاده می‌شود.

برای تغییر تجمیع پیش‌فرض:

روی یک measure در پنجره داده‌ها کلیک راست کنید (در مک، کلید کنترل را نگه دارید) و گزینه‌های Default Properties > Aggregation را انتخاب کنید و سپس یکی از گزینه‌های تجمیع را انتخاب کنید.

تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

توجه: شما می‌توانید از Tableau برای تجمیع معیارها فقط با منابع داده رابطه‌ای استفاده کنید. منابع داده چندبعدی فقط شامل داده‌های تجمیع‌شده هستند.

شما نمی‌توانید تجمیع‌های پیش‌فرض را برای منابع داده منتشر شده تنظیم کنید. تجمیع پیش‌فرض زمانی تنظیم می‌شود که منبع داده برای اولین بار منتشر می‌شود.

نحوه تفکیک داده‌ ها

هر زمان که یک معیار به View خود اضافه می‌کنید، به طور پیش‌فرض یک تجمیع برای آن معیار اعمال می‌شود. این پیش‌فرض توسط تنظیمات Aggregate Measures در منوی Analysis کنترل می‌شود.

اگر تصمیم دارید که تمام علامت‌های موجود در نما را در دقیق‌ترین سطح جزئیات (LOD) ببینید، می‌توانید view را تفکیک کنید. تفکیک داده‌های شما به این معنی است که Tableau برای هر مقدار داده در هر ردیف از منبع داده شما یک علامت جداگانه نمایش می‌دهد.

برای تفکیک همه معیارها در View:

گزینه Analysis > Aggregate Measures را پاک کنید. اگر قبلاً انتخاب شده است، یک بار روی Aggregate Measures کلیک کنید تا آن را از حالت انتخاب خارج کنید.

تجمیع داده‌ ها (Data Aggregation) در تبلو - داده کاوی ویستا

وقتی Aggregate Measures انتخاب می‌شود، Tableau به طور پیش‌فرض تلاش می‌کند تا معیارها را در View تجمیع کند. مقادیر سطرهای جداگانه از منبع داده شما در سطح جزئیات (LOD) در نمای شما در یک مقدار واحد (یک علامت واحد) تجمیع می‌شوند.

تجمیع‌های مختلف موجود برای یک معیار، نحوه جمع‌آوری مقادیر جداگانه را تعیین می‌کنند: آنها می‌توانند با هم جمع شوند (SUM)، میانگین‌گیری شوند (AVG)، یا روی حداکثر (MAX) یا حداقل (MIN) مقدار از مقادیر سطرهای جداگانه تنظیم شوند.

تفکیک داده‌ها می‌تواند برای تجزیه و تحلیل معیارهایی که ممکن است بخواهید به صورت مستقل و وابسته در View استفاده کنید، مفید باشد. به عنوان مثال، ممکن است نتایج یک نظرسنجی رضایت از محصول را با سن شرکت‌کنندگان در امتداد یک محور تجزیه و تحلیل کنید. شما می‌توانید فیلد سن را تجمیع کنید تا میانگین سن شرکت‌کنندگان را تعیین کنید یا داده‌ها را تفکیک کنید تا مشخص شود شرکت‌کنندگان در چه سنی بیشترین رضایت را از محصول داشته‌اند.

تفکیک داده‌ها می‌تواند زمانی مفید باشد که داده‌ها را به عنوان یک نمودار پراکندگی (scatter plot) مشاهده می‌کنید.

توجه: اگر منبع داده شما بسیار بزرگ است، تفکیک داده‌ها می‌تواند منجر به کاهش قابل توجه عملکرد شود.

مثال: نمودارهای پراکندگی، تجمیع و دانه‌بندی (Granularity)

اگر یک معیار را در قفسه ردیف‌ها و معیار دیگری را در قفسه ستون‌ها قرار دهید، از Tableau می‌خواهید که دو مقدار عددی را با هم مقایسه کند. معمولاً، Tableau در چنین مواردی یک scatter plot را به عنوان تجسم پیش‌فرض انتخاب می‌کند. نمای اولیه به احتمال زیاد یک علامت واحد خواهد بود که مجموع تمام مقادیر دو معیار را نشان می‌دهد. این به این دلیل است که شما باید سطح جزئیات (LOD) را در View افزایش دهید.

شروع به ساخت نمودار پراکندگی (scatter plot) کنید

 

آیا هنوز می خواهید بیشتر یاد بگیرید؟ نگران نباشید، آموزش Tableau به شما در درک بهتر ابزار کمک می کند. برای این منظور، ما ویدیوهایی در YouTube داریم که می‌توانید برای درک عملی بهتر از Tableau از آنها دیدن کنید. اگر علاقه مند به آموزش Tableau هستید، روی لینک زیر کلیک کنید تا در مورد آموزش Tableau VISTA بیشتر بدانید. همچنین می‌توانید با عضویت در کانال YouTube ما، مطالب رایگان بیشتری دریافت کنید.

به دنبال این هستید که داده های خود را از طریق تجزیه و تحلیل بصری به نمایش بذارید ؟ با ما در داده کاوی ویستا ارتباط برقرار کنید.

با یکی از کارشناسان داده ما تماس بگیرید و صحبت کنید، و ما به هر سوالی که ممکن است داشته باشید پاسخ خواهیم داد.

امیدواریم از این پست لذت برده باشید

برای مطالب بیشتر از وب سایت ما از جمله مطالعات موردی اضافی، اخبار و رویدادها، و نکات و ترفندهایی برای ارتقای تجزیه و تحلیل بصری خود، از وب سایت ما دیدن کنید.

رسانه های اجتماعی ما را برای به روز رسانی نرم افزارهای، BI و AI دنبال کنید.

 

دوره آموزشی هوش تجاری با Tableau »کلیک کنید« یک برنامه جامع است که بر توسعه مهارت در تجزیه‌ و تحلیل داده‌ها، تجسم و گزارش سازی و گزارش دهی و دشبوردسازی با استفاده از ابزار   Tableau تمرکز دارد.

سپاسگذاریم از وقتی که برای خواندن این مقاله گذاشتید

.

برای خرید لایسنس نرم افزار Tableau کلیک کنید

 

برای مشاهده ویدیوهای آموزشی داده کاوی و هوش تجاری ما را در شبکه های اجتماعی دنبال کنید

Youtube Chanel :VISTA Data Mining کانال یوتیوب

Aparat Chanel: VISTA Data Mining کانال آپارات

Instagram Chanel: VISTA Data Mining کانال اینستاگرام

Telegram Chanel: VISTA Data Mining کانال تلگرام

Linkedin Chanel: VISTA Company کانال لینکدین

 

آموزش تبلو

امتیاز دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سبد خرید
ورود

هنوز حساب کاربری ندارید؟

خانه
0 محصول سبد خرید
0 علاقه مندی