مشکل کیفیت داده در فرایند کاوی (بخش ۸: زمانبندی‌های متفاوت)

مشکل کیفیت داده در فرایند کاوی (بخش ۸: زمانبندی‌های متفاوت)

مشکل کیفیت داده در فرایند کاوی (بخش 8: زمانبندی‌های متفاوت)

Different Clocks

یکی از دلایل دشواری برای خطاهای زمانبندی این است که نشانگرهای زمانی در مجموعه داده های شما ممکن است توسط رایانه های متعدد که در ساعت های مختلف اجرا می شوند ثبت شود. به عنوان مثال، در این مورد مطالعه در اپراتورهای خدمات امنیتی، فعالیت های خود را هنگام ورود به سایت، عملیات مربوط به تعریف مشکل و غیره را در دستگاه های دستی خود ثبت کرده اند. این دستگاه های تلفن همراه گاهی زمانی متفاوت از  سرور و همچنین از سایر دستگاه ها داشتند.اگر به سناریو زیر نگاه کنید می بینید که چرا این مشکل بوجود می آید: فرض کنید یک حادثه جدید در ساعت 1:30 بعد از ظهر گزارش شود. پنج دقیقه بعد، یک اپراتور تلفن همراه به درخواست پاسخ می دهد و نشان می دهد که برای برطرف کردن آن به محل می رود. با این حال، به دلیل اینکه ساعت در دستگاه تلفن همراه  10 دقیقه جلوتر است، نشانگر زمان ثبت شده 1:25 PM است.هنگامی که شما تمام نشانه های مختلف در مجموعه داده های خود را برای انجام تجزیه و تحلیل  فرآیند ترکیب کنید، خواهید دید که پاسخ اپراتور قبل از گزارش حادثه اولیه نشان داده می شود. این نه تنها جریان های نادرست را در نقشه فرآیند و گزینه های شما ایجاد می کند، بلکه زمانی که سعی می کنید زمان بین وقوع حادثه و اولین پاسخ را اندازه گیری کنید، در واقع به شما یک زمان منفی بر می گرداند.

اول، بررسی کنید که آیا جریان ساعت در طول زمان سازگار است و فعالیت هایی که تحت تاثیر قرار می گیرند را مشخص کنید. سپس، گزینه های زیر را در نظر بگیرید:

(حل مساله)

۱- اگر تفاوت ساعت کاملا سازگار باشد، می توانید آن را در داده های منبع خود اصلاح کنید. به عنوان مثال، در سناریوی فوق شما می توانید 10 دقیقه به برچسب های زمانی از اپراتور محلی اضافه کنید.

۲- اگر تصحیح کلی امکان پذیر نیست، می توانید سعی کنید اطلاعات خود را با حذف مواردی که در سفارش اشتباه نشان داده شده است پاک سازی کنید. توجه داشته باشید که فیلتر دنبال کننده در دیسکو[1] همچنین به شما اجازه می دهد موارد را حذف کنید، در حالی که بیشتر یا کمتر از یک مقدار معین شده بین دو فعالیت گذشته است. به این ترتیب، شما می توانید مشکلات جزئی رانش ساعت (معمولا تفاوت ها فقط چند ثانیه) را از مواردی که فعالیت های دوگانه در واقع با تفاوت زمان قابل توجهی ثبت شده اند، جدا کنید. اطمینان حاصل کنید که مجموعه داده باقی مانده پس از پاک سازی است.

۳- اگر چیزی به شما کمک نمی کند، ممکن است مجبور شوید که به سیستم جمع آوری داده های خود بازگردید و مکانیزم هماهنگ سازی ساعت را تنظیم کنید تا به طور مداوم تفاوت های زمانی بین دستگاه های شبکه را اندازه گیری کنید و زمان ضبط صحیح را در هنگام ضبط اطلاعات در طول مسیر بدست آورید.

نویسنده: خانم Anne Rozinat
مرجع خبر:

Data Quality Problems in Process Mining and What To Do About Them — Part 8: Different Clocks

 

 

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقایسه
علاقه مندی ها 0