هر منبع داده ای که در Tableau ایجاد می کنید یک مدل داده دارد.شما می توانید یک مدل داده را به عنوان یک نمودار در نظر بگیرید که به Tableau می گوید که چگونه باید داده ها را در جداول پایگاه داده متصل جستجو کند.
جداولی که در صفحه منبع داده به بوم اضافه می کنید ساختار مدل داده را ایجاد می کند.یک مدل داده می تواند ساده باشد، مانند یک جدول.
یا میتواند پیچیدهتر باشد، با جداول متعددی که از ترکیبهای متفاوتی از روابط، پیوندها و اتحادیهها استفاده میکنند.
مدل داده دارای دو لایه است:
- نمای پیش فرضی که برای اولین بار در بوم صفحه منبع داده می بینید، لایه منطقی منبع داده است.
شما داده ها را در لایه منطقی با استفاده از روابط (یا نودل) ترکیب می کنید.این لایه را به عنوان بوم روابط در صفحه منبع داده در نظر بگیرید. برای اطلاعات بیشتر، به استفاده از روابط برای تجزیه و تحلیل داده های چند جدولی مراجعه کنید.
- لایه بعدی لایه فیزیکی است. شما داده ها را بین جداول در لایه فیزیکی با استفاده از اتصالات (پیوند در یک پنجره جدید باز می شود) و اتحادیه ها ترکیب می کنید.
هر جدول منطقی شامل حداقل یک جدول فیزیکی در این لایه است. لایه فیزیکی را به عنوان بوم Join/Union در صفحه منبع داده در نظر بگیرید. برای مشاهده یا افزودن پیوندها و اتحادها، روی یک جدول منطقی دوبار کلیک کنید.
نمای سطح بالای یک منبع داده با چندین جداول مرتبط. این لایه منطقی است.
جداول منطقی را می توان با استفاده از روابط (نودل) ترکیب کرد. آنها از انواع اتصال استفاده نمی کنند. آنها مانند ظروف برای جداول فیزیکی عمل می کنند.
برای باز کردن جدول منطقی و دیدن جداول فیزیکی آن، دوبار کلیک کنید.
جداول فیزیکی را می توان با استفاده از اتصال یا اتحاد ترکیب کرد. در این مثال، جدول منطقی Book از سه جدول فیزیکی به هم پیوسته (کتاب، جایزه، اطلاعات) ساخته شده است.
برای مشاهده ویدیوی آموزشی Custom Tooltip in Tableau در یوتیوب لینک زیر را کلیک کنید ⇓
لایه های مدل داده
نمای سطح بالایی که از منبع داده می بینید، لایه منطقی مدل داده است.
شما همچنین می توانید آن را به عنوان بوم Relationships در نظر بگیرید، زیرا در اینجا جداول را با استفاده از روابط به جای اتصالات ترکیب می کنید.
وقتی دادهها را از چندین جدول ترکیب میکنید، هر جدولی که در لایه منطقی به بوم میکشید باید با جدول دیگری رابطه داشته باشد. شما نیازی به تعیین انواع اتصال برای روابط ندارید. در طول تجزیه و تحلیل Tableau به طور خودکار انواع اتصال مناسب را بر اساس زمینه ها و زمینه تجزیه و تحلیل در کاربرگ انتخاب می کند.
لایه فیزیکی مدل داده جایی است که می توانید داده ها را با استفاده از اتصالات و اتحادیه ها ترکیب کنید.
در این بوم فقط می توانید از محورها استفاده کنید. می توانید آن را به عنوان بوم Join/Union در نظر بگیرید.
در نسخه های قبلی Tableau، لایه فیزیکی تنها لایه در مدل داده بود. هر جدول منطقی می تواند شامل یک یا چند جدول فیزیکی باشد.
مهم: همچنان میتوانید منابع داده تک جدولی را در Tableau ایجاد کنید که از پیوندها و اتحادیهها استفاده میکنند. رفتار تجزیه و تحلیل تک جدولی در Tableau تغییر نکرده است.
درک مدل داده
در نسخه های قبلی Tableau، مدل داده فقط دارای لایه فیزیکی بود. در Tableau 2020.2 به بعد، مدل داده دارای لایه منطقی (معنی) و یک لایه فیزیکی است.
این گزینههای بیشتری را برای ترکیب دادهها با استفاده از طرحوارهها به تناسب تحلیل شما در اختیار شما قرار میدهد.
در Tableau 2020.2 به بعد، یک لایه منطقی در منبع داده اضافه شده است. هر جدول منطقی شامل جداول فیزیکی در یک لایه فیزیکی است.
در نسخههای قبلی Tableau، مدل داده در منبع داده شما از یک لایه فیزیکی منفرد تشکیل شده بود که میتوانید اتصالات و اتحادیهها را مشخص کنید.
جداول اضافه شده به لایه فیزیکی (به هم پیوسته یا یکپارچه) یک جدول منفرد و مسطح (غیر عادی) برای تجزیه و تحلیل ایجاد می کنند.
یک مدل جدید بسازید
- هنگامی که یک یا چند جدول را به لایه منطقی اضافه می کنید، اساساً در حال ساخت مدل داده برای منبع داده خود هستید. یک منبع داده می تواند از یک جدول منفرد و منطقی ساخته شود، یا می توانید چندین جدول را روی بوم بکشید تا یک مدل پیچیده تر ایجاد کنید.
- اولین جدولی که به بوم می کشید تبدیل به جدول اصلی مدل داده در منبع داده شما می شود.
- پس از کشیدن جدول ریشه، می توانید جداول اضافی را به هر ترتیبی بکشید. شما باید در نظر بگیرید که کدام جداول باید به یکدیگر مرتبط باشند، و جفت فیلدهای تطبیقی که برای هر رابطه تعریف می کنید.
- اگر شما در حال ایجاد یک طرحواره ستاره هستید، می تواند مفید باشد که ابتدا جدول واقعیت را به بیرون بکشید و سپس جداول ابعاد را به آن جدول مرتبط کنید.
- حذف یک جدول در بوم به طور خودکار فرزندان مرتبط آن را نیز حذف می کند. اگر جدول ریشه را حذف کنید، تمام جداول دیگر در مدل نیز حذف می شوند.
- هر رابطه باید از حداقل یک جفت فیلد منطبق ساخته شود. برای ایجاد یک رابطه مرکب، چندین جفت فیلد اضافه کنید. جفت های منطبق باید نوع داده یکسانی داشته باشند. تغییر نوع داده در صفحه منبع داده این نیاز را تغییر نمی دهد. Tableau همچنان از نوع داده در پایگاه داده زیربنایی برای پرس و جوها استفاده خواهد کرد.
- روابط می تواند بر اساس زمینه های محاسبه شده باشد.
- شما می توانید تعیین کنید که چگونه فیلدهای مورد استفاده در روابط باید با استفاده از عملگرها در هنگام تعریف رابطه مقایسه شوند.
Multi-table model
برای ایجاد یک مدل چند جدولی، جداول را به لایه منطقی بوم صفحه منبع داده بکشید.
جداولی که به لایه منطقی بوم صفحه منبع داده می کشید باید به یکدیگر مرتبط باشند.
هنگامی که جداول اضافی را به بوم لایه منطقی می کشید، Tableau به طور خودکار تلاش می کند تا رابطه را بر اساس محدودیت های کلیدی موجود و فیلدهای تطبیق ایجاد کند تا رابطه را تعریف کند.
اگر نمی تواند فیلدهای تطبیق را تعیین کند، باید آنها را انتخاب کنید.
اگر هیچ محدودیتی شناسایی نشود، یک رابطه Many-to-Many ایجاد می شود و یکپارچگی ارجاعی بر روی Some records match تنظیم می شود.
این تنظیمات پیشفرض یک انتخاب مطمئن هستند و بیشترین انعطافپذیری را برای منبع داده شما فراهم میکنند.
تنظیمات پیشفرض از اتصالهای بیرونی کامل پشتیبانی میکنند و پرسوجوها را با جمعآوری دادههای جدول قبل از تشکیل اتصالها در طول تجزیه و تحلیل بهینه میکنند.
تمام داده های ستون و ردیف از هر جدول برای تجزیه و تحلیل در دسترس می شود.
با دوبار کلیک کردن روی جدول می توانید داده های بیشتری را در داخل هر جدول منطقی اضافه کنید.
این لایه فیزیکی بوم صفحه منبع داده را باز می کند.
اگر نیاز به استفاده از پیوندها یا اتحادها دارید، میتوانید جداولی را که میخواهید به آنها بپیوندید یا اتحاد کنید به بوم لایه فیزیکی بکشید. جداول فیزیکی در جدول منطقی خود ادغام می شوند.
Single-table model
برای ایجاد یک مدل تک جدولی، یک جدول را به بوم لایه منطقی صفحه منبع داده بکشید. سپس می توانید از فیلدهای آن جدول در صفحه Data برای تجزیه و تحلیل استفاده کنید.
مدل تک جدولی که شامل جداول دیگری است
میتوانید با دوبار کلیک کردن روی جدول، دادههای بیشتری را در جدول منفرد و منطقی اضافه کنید.
این لایه فیزیکی بوم صفحه منبع داده را باز می کند. اگر نیاز به استفاده از پیوندها یا اتحادها دارید.
میتوانید جداولی را که میخواهید به آنها بپیوندید یا اتحاد کنید به بوم لایه فیزیکی بکشید. جداول فیزیکی در جدول منطقی خود ادغام می شوند.
این مثال جدول Book را در بوم Relationships (لایه منطقی) منبع داده نشان می دهد. با دوبار کلیک کردن روی جدول منطقی Book، بوم Join/Union (لایه فیزیکی) باز می شود.
در این مثال، Join ها جداول Award و Info را با جدول Book ادغام می کنند.
در این صورت، پیوند بین کتاب و جایزه در سطح جزئیات جوایز یک به چند خواهد بود. این مقادیر اندازه گیری کتاب و اطلاعات را تکرار می کند.
برای جلوگیری از تکرار، میتوانید جایزه و اطلاعات را به جای پیوستن آنها در جدول منطقی کتاب به کتاب مرتبط کنید.
Supported data model schemas
قابلیتهای مدلسازی دادهای که در سال 2020.2 به Tableau معرفی شدهاند، به گونهای طراحی شدهاند که تجزیه و تحلیل سناریوهای دادههای چند جدولی رایج – از جمله مدلهای داده ستاره و دانههای برف – را آسان کند.
انواع مدل های زیر در منابع داده Tableau پشتیبانی می شوند.
Single-table
تجزیه و تحلیل بر روی یک جدول منطقی منفرد که حاوی ترکیبی از ابعاد و اندازهها است، درست مانند Tableau قبل از 2020.2 عمل میکند.
شما می توانید یک جدول منطقی با استفاده از ترکیبی از اتصالات، اتحادیه ها، SQL سفارشی و غیره بسازید.
Star and Snowflake
در انبارهای داده سازمانی، ساختار دادهها در طرحوارههای ستارهای یا دانههای برف معمول است .
در آن اندازهها در یک جدول واقعی مرکزی قرار دارند و ابعاد به طور جداگانه در جداول ابعاد مستقل ذخیره میشوند.
این سازماندهی دادهها از بسیاری از جریانهای تحلیل رایج از جمله جمعآوری و حفاری پشتیبانی میکند.
این مدلها را میتوان مستقیماً با روابط در قابلیتهای مدلسازی دادههای موجود از Tableau 2020.2 نشان داد.
ابتدا جدول واقعیت را به مدل بکشید و سپس جداول ابعاد را به جدول واقعیت (در یک طرحواره ستاره ای) یا به جداول ابعاد دیگر (در یک دانه برف) مرتبط کنید.
به طور معمول، در یک طرح واره ستاره یا دانه برف که به خوبی مدل شده است، روابط بین جدول واقعیت و جداول ابعاد چند به یک خواهد بود.
اگر این اطلاعات در انبار داده شما رمزگذاری شده باشد، Tableau به طور خودکار از آن برای تنظیم گزینه های عملکرد رابطه استفاده می کند.
اگر نه، می توانید این اطلاعات را خودتان تنظیم کنید. برای اطلاعات بیشتر، بهینه سازی پرس و جوهای رابطه با استفاده از گزینه های عملکرد را ببینید.
در یک طرح ستاره یا دانه برف که به خوبی مدلسازی شده است، هر ردیف در جدول حقایق دارای یک ورودی مطابق در هر یک از جداول ابعاد است.
اگر این درست باشد و در محدودیتهای یکپارچگی انبار دادههای شما ثبت شود، Tableau به طور خودکار از این اطلاعات برای تنظیم یکپارچگی ارجاعی در گزینههای عملکرد استفاده میکند.
اگر برخی از ردیفهای جدول حقایق دارای یک ردیف منطبق در جدول ابعاد نباشند (که گاهی اوقات «ابعاد دیررس» یا «واقعیتهای زودرس» نامیده میشود)، Tableau بهطور پیشفرض تمام ردیفها را هنگام محاسبه اندازهگیریها حفظ میکند.
اما ممکن است هنگام نمایش مقادیر کاهش یابد.
ستاره (Star) و Snowflake با اندازه هایی در بیش از یک جدول
در برخی از طرحواره های ستاره یا دانه های برف، تمام معیارهای تجزیه و تحلیل شما در جدول واقعیت موجود است.
با این حال، اغلب درست است که معیارهای اضافی مورد علاقه ممکن است به جداول ابعاد در تجزیه و تحلیل شما مرتبط باشد.
حتی اگر جداول ابعاد شامل اندازه گیری نباشند، در تجزیه و تحلیل معمول است که بخواهیم مقادیر ابعاد را شمارش کنیم یا به شکل دیگری جمع کنیم.
در این موارد، تمایز بین جداول واقعیت و جداول ابعاد کمتر مشخص است.
برای ایجاد وضوح در هنگام مشاهده مدل دادههای خود، توصیه میکنیم ابتدا بهترین جدول دانه را به بوم منبع داده اضافه کنید و سپس همه جداول دیگر را به جدول اول مرتبط کنید.
اگر بخواهید این جداول را به یکدیگر در یک جدول منطقی ملحق کنید، اندازهگیریها در جداول ابعاد تکرار میشوند و در نتیجه مجموعها تحریف میشوند.
مگر اینکه اقدامات احتیاطی برای کپی کردن مقادیر با استفاده از محاسبات LOD یا COUNT DISTINCT انجام داده باشید.
با این حال، اگر به جای آن روابطی بین این جداول ایجاد کنید، Tableau اقدامات را قبل از انجام اتصالها جمعآوری میکند.
از مشکل تکراری غیر ضروری جلوگیری میکند. این شما را از نیاز به پیگیری دقیق سطح جزئیات اقدامات خود رها می کند.
تحلیل چند واقعیت
قابلیتهای مدلسازی دادههای Tableau از برخی اشکال تحلیل چند واقعیت پشتیبانی میکند.
جداول واقعیت اضافی (شامل معیارها) را می توان به هر یک از مدل های ذکر شده قبلی اضافه کرد تا زمانی که فقط به یک جدول تک بعدی مربوط باشند.
برای مثال، میتوانید دو یا چند جدول واقعیت را برای تجزیه و تحلیل یک بعد مشترک، مانند تحلیلهای مشتری 360، کنار هم بیاورید. این جداول واقعیت می توانند در سطح متفاوتی از جزئیات با جدول ابعاد یا از یکدیگر باشند.
آنها همچنین می توانند با جدول ابعاد رابطه چند به چند داشته باشند. در این سناریوها، Tableau اطمینان حاصل می کند که مقادیر قبل از تجمیع تکرار نمی شوند.
اگر جدول ابعاد مشترکی ندارید که جداول واقعی شما را به هم مرتبط کند، گاهی اوقات می توانید به صورت پویا با استفاده از SQL سفارشی یا با استفاده از پیوندها یا اتحادهای جداول ابعاد دیگر، یکی بسازید.
دو جدول واقعیت را می توان مستقیماً در یک بعد مشترک به یکدیگر مرتبط کرد.
این نوع تجزیه و تحلیل زمانی بهترین کار را دارد که یکی از جداول واقعیت حاوی ابرمجموعه ای از بعد مشترک باشد.
مدل های پشتیبانی نشده
جداول چندگانه واقعیت مربوط به چند جداول ابعاد مشترک. در برخی موارد استفاده، داشتن جداول چندگانه واقعیت مربوط به چند جدول ابعاد مشترک معمول است.
به عنوان مثال، ممکن است دو جدول واقعی داشته باشید، فروش فروشگاه و فروش اینترنتی، مربوط به دو جدول بعدی متداول، تاریخ و مشتری.
به طور معمول، چنین سناریوهایی نیاز به ایجاد یک رابطه دایره ای در مدل داده شما دارند. روابط دایره ای در 2020.2 پشتیبانی نمی شود.
شما می توانید این نوع مدل را با ادغام برخی از جداول در لایه فیزیکی تقریبی کنید.
به عنوان مثال، ممکن است بتوانید فروش فروشگاه و فروش اینترنتی را در یک جدول واحد ادغام کنید، که سپس می تواند به تاریخ و مشتری مرتبط شود.
از طرف دیگر، ممکن است بتوانید تاریخ و مشتری را برای ایجاد یک جدول تک بعدی که می تواند به فروش فروشگاه و فروش اینترنتی مرتبط باشد، به یکدیگر متصل کنید.
ارتباط مستقیم 3 یا چند جدول واقعیت در ابعاد مشترک. در حالی که امکان ساخت این مدل در لایه منطقی وجود دارد، ممکن است نتایج ناخواسته ای را مشاهده کنید، مگر اینکه فقط از ابعاد یک جدول استفاده کنید.
الزامات روابط در یک مدل داده
هنگام مرتبط کردن جداول، فیلدهایی که روابط را تعریف می کنند باید نوع داده یکسانی داشته باشند.
تغییر نوع داده در صفحه منبع داده این نیاز را تغییر نمی دهد. Tableau همچنان از نوع داده در پایگاه داده زیربنایی برای پرس و جوها استفاده خواهد کرد.
- شما نمی توانید روابط را بر اساس زمینه های جغرافیایی تعریف کنید.
- روابط دایره ای در مدل داده پشتیبانی نمی شود.
- شما نمی توانید روابط بین منابع داده منتشر شده را تعریف کنید.
عواملی که مزایای استفاده از جداول مرتبط را محدود می کند
دادههای کثیف در جداول (یعنی جداولی که با مدلی ساختاریافته ایجاد نشدهاند و حاوی ترکیبی از اندازهها و ابعاد در جداول متعدد هستند) میتوانند تجزیه و تحلیل چند جدولی را پیچیدهتر کنند.
- استفاده از فیلترهای منبع داده، توانایی Tableau را برای حذف پیوستن به داده ها محدود می کند. Join cullling اصطلاحی است برای اینکه چگونه Tableau پرس و جوها را با حذف اتصالات غیر ضروری ساده می کند.
- جداول با مقادیر بینظیر زیادی در بین روابط.
- ارتباط متقابل جداول واقعیت چندگانه با جداول چند بعدی (تلاش برای مدل سازی ابعاد مشترک یا مطابقت شده).
به دنبال این هستید که داده های خود را از طریق تجزیه و تحلیل بصری به نمایش بذارید ؟ با ما در داده کاوی ویستا ارتباط برقرار کنید.
با یکی از کارشناسان داده ما تماس بگیرید و صحبت کنید، و ما به هر سوالی که ممکن است داشته باشید پاسخ خواهیم داد.
دوره آموزشی هوش تجاری با Tableau »کلیک کنید« یک برنامه جامع است که بر توسعه مهارت در تجزیه و تحلیل دادهها، تجسم و گزارش سازی و گزارش دهی و دشبوردسازی با استفاده از ابزار Tableau تمرکز دارد.
سپاسگذاریم از وقتی که برای خواندن این مقاله گذاشتید
.
برای خرید لایسنس تبلو Tableau کلیک کنید
.
برای مشاهده ویدیوهای آموزشی داده کاوی و هوش تجاری ما را در شبکه های اجتماعی دنبال کنید
Youtube Chanel :VISTA Data Mining
Aparat Chanel: VISTA Data Mining
Instagram Chanel: VISTA Data Mining
Telegram Chanel: VISTA Data Mining
Linkedin Chanel: VISTA Company