مشکل کیفیت داده در فرایند کاوی (بخش ۷: برچسب‌های زمانی موجود، زمان واقعی فرآیندها را نشان نمی‌دهند)

مشکل کیفیت داده در فرایند کاوی (بخش ۷: برچسب‌های زمانی موجود، زمان واقعی فرآیندها را نشان نمی‌دهند)

مشکل کیفیت داده در فرایند کاوی (بخش 7: برچسب‌های زمانی موجود، زمان واقعی فرآیندها را نشان نمی‌دهند)

Recorded Timestamps Do Not Reflect Actual Time of Activities

سال گذشته یک شرکت بیمه هلندی روند تحلیل فرآیند را برای  چندین فرایند خود تکمیل کرد. برای بعضی از فرآیندها، این کار به خوبی انجام شد و توانست دید ارزشمندی  به سرمایه گذاران بدهد. با این حال، برای بخش عمده ای از مهم ترین فرایندهای مرکزی، متوجه شدند که سیستم گردش کار در راه استفاده از آن ها آن طور که باید استفاده نشده است.

اتفاقی که افتاد این بود که کارکنان پرونده ها را برای رسیدگی به میز کار خود بردند، روی آن کار کردند. در پایان هفته، آنها سپس به سیستم اطلاعاتی وارد شدند و اطلاعات را وارد کردند – اساسا مستندسازی کارهایی که قبلا انجام داده بودند.

این روش کار دو مشکل دارد:این نشان می دهد که سیستم از کارکنان مورد حمایت در آنچه که باید انجام دهند پشتیبانی نمی کند. در غیر این صورت آنها می خواهند از سیستم استفاده کنند تا آنها را همراهی کنند. در عوض، مستند سازی در سیستم یک کار اضافی، خسته کننده است که تا آنجا که ممکن است به تاخیر افتاده است.البته این بدان معنی است که برچسب های زمانی که در سیستم ضبط می شوند، واقعی  نیستند.بنابراین، انجام تجزیه و تحلیل فرآیند بر اساس این داده ها بی فایده است.این شرکت در حال کار بر روی بهبود سیستم برای حمایت بهتر از کارکنان خود است و – در نهایت – همچنین قادر خواهد بود مجدد پروژه بازیابی فرآیندهای خود را دوباره راه اندازی کند.شما ممکن است با چنین مشکلی در حوزه های مختلف روبرو شده باشید. به عنوان مثال، یک پزشک ممکن است تمام روز در حال راه رفتن باشد، با بیماران صحبت کند، تجویز کند، و غیره، و در پایان روز او در دفترش نشسته و وظایف انجام شده برای سیستم اداری را می نویسد. مثال دیگر این است که نشانگرهای زمانی یک گام فرایند خاص به صورت دستی وارد می شوند و افراد هنگام ورود  آنها خطاهای خاصی را ایجاد می کنند.

(حل مساله)

اول از همه، شما باید آگاه باشید که اطلاعات شما دارای این مشکل است. به همین دلیل مرحله اعتبار سنجی داده بسیار مهم است.هنگامی که به ارزیابی شدت فاصله بین نشانه های ضبط شده در داده های خود و زمان های واقعی فعالیت های ضبط شده می پردازید، باید تصمیم بگیرید که آیا (الف) مسئله محلی یا قابل پیش بینی است یا (ب) همه جانبه و همچنین برای تجزیه و تحلیل داده ها مفید نیست.اگر مشکل تنها بر فعالیت خاص یا بخشی از فرایند شما تاثیر می گذارد (محلی)، می توانید از این فعالیت های خاص به دلیل وجود عدم اطمینان کافی به صحت آن ها صرف نظر کنید. پس از آن، شما هنوز می توانید بقیه روند را تجزیه و تحلیل کنید. اگر افست اینقدر بزرگ و قابل پیش بینی نیست (مثل دکتر که در انتهای روز فعالیت های خود را ثبت می کند)، می توانید تجزیه و تحلیل خود را در یک مقیاس بزرگتر انجام دهید. به عنوان مثال، شما می دانید که منطقی نیست که فعالیت های پزشک در بیمارستان را در ساعت یا دقیقه (حتی اگر زمان بندی های ثبت شده دقیقه را از لحاظ فنی) انجام دهید. اما شما هنوز هم می توانید روند را در یک سطح روزانه تجزیه و تحلیل کنید.در نهایت، اگر مشکل خیلی زیاد است و شما نمی دانید زمانی که هر یک از فعالیت ها واقعا اتفاق افتاده (مانند مثال شرکت بیمه)، ممکن است مجبور شوید تصمیم بگیرید که داده ها به اندازه کافی مناسب برای استفاده در بازیابی فرآیند شما نیست.

نویسنده: خانم Anne Rozinat
مرجع خبر:

Data Quality Problems in Process Mining and What To Do About Them — Part 7: Recorded Timestamps Do Not Reflect Actual Time of Activities

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقایسه
علاقه مندی ها 0