مقالات

استفاده از داده کاوی برای تشخیص تقلب – Use Data Mining for Fraud Detection

استفاده از داده کاوی برای تشخیص تقلب

Use Data Mining for Fraud Detection

میلیاردها دلار در اثر اقدامات کلاهبرداری از دست رفته است. روش های سنتی کشف تقلب زمان بر و پیچیده است. داده کاوی در ارائه الگوهای معنی دار و تبدیل داده ها به اطلاعات کمک می کند. هر اطلاعاتی که معتبر و مفید باشد دانش است. یک سیستم کامل کشف تقلب باید از اطلاعات همه کاربران محافظت کند. یک روش نظارت شده شامل مجموعه سوابق نمونه است. این سوابق طبقه بندی شده کلاهبرداری یا غیر کلاهبرداری است. با استفاده از این داده ها یک مدل ساخته می شود و الگوریتم ساخته می شود تا تشخیص دهد که رکورد جعلی است یا خیر.

امروزه بازار ارتباطات از راه دور در سراسر جهان به دلیل رقابت شدید و از دست دادن درآمد ناشی از تقلب با افت شدید درآمد روبرو شده است.

 برای زنده ماندن در بازار ، اپراتورهای مخابراتی معمولاً انواع روش های داده کاوی را برای کشف تقلب ارائه می دهند. طبق بازار مخابرات ، روند تقلب مشترکین (اعم از پیش پرداخت یا پولی) همچنان برای هر صنعت مخابرات اتفاق می افتد ، این امر منجر به از دست دادن درآمد بزرگ شرکت می شود.

در این شرایط ، تنها راه حل برای غلبه بر چنین خطرات تجاری و حفظ آن در بازار ، اپراتورها مجبور می شوند که به دنبال روش های جایگزین استفاده از تکنیک های داده کاوی و ابزارهای آماری برای شناسایی علت از قبل و تلاش سریع در پاسخ به آنها باشند.

 

داده کاوی چیست و چه کاربردهایی دارد؟

 

این در صورت تجزیه و تحلیل سیستماتیک تاریخچه گذشته مشتریان امکان پذیر است. خوشبختانه صنایع مخابراتی حجم زیادی از داده ها را تولید و حفظ می کنند. آنها شامل اطلاعات صورتحساب ، اطلاعات جزئیات تماس و داده های شبکه هستند.

این داده های با حجم زیاد دامنه استفاده از تکنیک های داده کاوی در پایگاه داده مخابراتی را تضمین می کند.

از آنجایی که اطلاعات زیادی در داده های تولید شده توسط صنایع مخابراتی پنهان است ، پژوهشگران زمینه زیادی برای تجزیه و تحلیل داده ها از دیدگاه های مختلف و کمک به اپراتورها برای بهبود تجارت خود از طرق مختلف دارند.

متداول ترین زمینه های تحقیق در پایگاه داده های مخابراتی به طور کلی در ۳ نوع طبقه بندی می شود :

  1. تشخیص تقلب از راه دور
  2. پیش بینی انفجار مخابراتی
  3. شناسایی و جداسازی خطای شبکه.

علاوه بر این ، همه موارد داده پایگاه داده مخابرات توسط تمام تکنیک ها استفاده نمی شود. فقط داده های مربوطه که واقعاً به تجزیه و تحلیل خاص کمک می کنند باید برای هر مطالعه در نظر گرفته شوند. این مطالعه بر روی کشف تقلب و استفاده از تکنیک های داده کاوی در کشف تقلب در داده های تلکام متمرکز است.

 

داده کاوی برای تشخیص تقلب
استفاده داده کاوی برای تشخیص تقلب

 

استخراج اطلاعات: یک نظرسنجی OV

۱-  تعریف

“داده کاوی” به عنوان یک قابلیت جستجوی پیشرفته داده تعریف می شود که با استفاده از الگوریتم های آماری الگوها و همبستگی ها را در داده ها کشف می کند.

 داده کاوی دانش (“data   nuggets”) را که در انبارهای داده شرکت ها دفن شده است ، یا اطلاعاتی را که بازدیدکنندگان در یک وب سایت رها کرده اند ، می یابد و استخراج می کند ، که بیشتر آنها می تواند منجر به بهبود درک و استفاده از داده ها شود.

داده کاوی الگوها و روابط پنهان شده در داده ها را کشف می کند، و در واقع بخشی از یک فرآیند بزرگتر به نام “کشف دانش” است که مراحل لازم برای اطمینان از نتایج معنی دار را توصیف می کند. داده کاوی به تحلیل گران تجارت کمک می کند تا فرضیه هایی تولید کنند ، اما این فرضیه ها را تأیید نمی کند.

۲- تکامل داده کاوی

تکنیک های داده کاوی نتیجه یک تحقیق طولانی و فرآیند تولید محصول است. منشأ داده کاوی در اولین ذخیره سازی داده ها در رایانه با پیشرفت در دسترسی به داده ها ادامه دارد ، تا اینکه امروز فناوری به کاربران امکان می دهد تا در زمان واقعی از طریق داده ها پیمایش کنند.

 در تکامل از داده های تجاری به اطلاعات مفید ، هر مرحله براساس مراحل قبلی ساخته می شود.

 در مرحله اول ، جمع آوری داده ها ، سایت های منفرد داده هایی را برای استفاده در محاسبات ساده مانند جمع بندی یا میانگین جمع آوری کردند. گام دوم ، سیاست های کل شرکت برای جمع آوری داده ها و گزارش اطلاعات مدیریت ایجاد شد.

پس از مشخص شدن ارقام منفرد ، می توان سوالاتی را جستجو کرد که عملکرد سایت های جمع شده را جستجو می کنند.

 به عنوان مثال ، فروش منطقه ای برای یک دوره مشخص می تواند محاسبه شود. ، یک کسب و کار می تواند یک دیدگاه جهانی بدست آورد یا یک سایت خاص را برای مقایسه با همتایان خود جستجو کند (پیمایش داده).

 سرانجام ، ابزارهای تحلیلی آنلاین بازخورد و تبادل اطلاعات در زمان واقعی را با واحدهای تجاری مشترک (داده کاوی) فراهم کردند.

مولفه های اصلی فناوری داده کاوی برای دهه ها در زمینه های تحقیقاتی مانند آمار ، هوش مصنوعی و یادگیری ماشین در حال توسعه بوده است.

۳- تکنیک های داده کاوی

  ابزارهای داده کاوی داده ها را گرفته و نمایشی از واقعیت را در قالب یک مدل می سازند. مدل حاصل الگوها و روابط موجود در داده ها را توصیف می کند. از جهت گیری فرآیند ، فعالیت های داده کاوی به سه دسته کلی تقسیم می شوند:

۱- کشف – فرآیند جستجو در یک پایگاه داده برای یافتن الگوهای پنهان بدون ایده یا فرضیه از پیش تعیین شده درباره اینکه الگوها چه هستند.

۲- مدل سازی پیش بینی – فرآیند گرفتن الگوهای کشف شده از پایگاه داده و استفاده از آنها برای پیش بینی آینده.

۳- تجزیه و تحلیل قانونی – فرآیند استفاده از الگوهای استخراج شده برای یافتن عناصر داده ای غیر عادی یا غیرمعمول. داده کاوی برای ساخت شش نوع مدل با هدف حل مشکلات تجاری استفاده می شود: طبقه بندی ، رگرسیون ، سری زمانی ، خوشه بندی ، تجزیه و تحلیل ارتباط و کشف توالی.

 دو مورد اول ، طبقه بندی و رگرسیون ، برای پیش بینی استفاده می شود ، در حالی که ارتباط و کشف توالی برای توصیف رفتار استفاده می شود. از خوشه بندی می توان برای پیش بینی یا توصیف استفاده کرد. شرکتهای صنایع مختلف می توانند با استخراج بانکهای اطلاعاتی در حال گسترش خود برای کسب اطلاعات دقیق و ارزشمند معاملات ، برتری رقابتی کسب کنند.

 

 

استفاده داده کاوی برای تشخیص تقلب

برای دانلود دوره های داده کاوی کلیک کنید

برای دانلود دوره آموزشی تبلو کلیک کنید.


پیام بگذارید

پشتیبانی 24 ساعته آنلاین