مشکل کیفیت داده در فرایند کاوی (بخش ۴: تنظیمات اشتباه برچسب‌های زمانی)

مشکل کیفیت داده در فرایند کاوی (بخش ۴: تنظیمات اشتباه برچسب‌های زمانی)

مشکل کیفیت داده در فرایند کاوی (بخش 4: تنظیمات اشتباه برچسب‌های زمانی)

Wrong Timestamp Configuration

در مقاله قبلی که در رابطه با برچسب های زمانی صفر بود، دیدیم که چگونه مشکلات زمان بندی می تواند منجر به زمان نامناسب هر مورد شود. اما نشانه های معیوب نه تنها طول مدت هر مورد را تحت تاثیر قرار می دهند. آنها همچنین تنوع و زمان بندی  ها را نیز تحت تاثیر قرار می دهند، زیرا نظم فعالیت ها براساس نشانه های زمانی مشخص می شود.به عنوان مثال،  به داده های زیر با تنها یک نشانه زمانی معیوب نگاه کنید. یک مورد با تایمر 1970 وجود دارد. در نتیجه، فعالیت «ایجاد موارد» قبل از فعالیت «واردات فرمها» قرار می گیرد.

اگر به نقشه فرآیندها نگاه کنیم، متوجه می شویم که در تمام 456 مورد دیگر، روند دیگری برای جریان دارد. واضح است که دنباله معکوس به دلیل وجود برچسب زمانی 1970  است.

و اگر ما به میانگین زمان انتظار در نقشه فرآیند نگاه کنیم، متوجه خواهیم شد که یک  نشانه زمانی معیوب مشکلات بیشتری را بوجود می آورد و تاخیر زیادی را به طول  43 سال ایجاد می کند.

همانطور که می بینید، مشکلات کیفیت داده با توجه به مسائل زمان بندی می تواند تجزیه و تحلیل بازیابی فرایند را در بسیاری از نقاط مختلف تحریف کند. بنابراین، مهم است که نقشه های فرآیند و انواع، اگر ممکن است همراه با یک متخصص  در این حوزه، به منظور ارزیابی هر گونه  روال مشکوک فعالیت ها انجام شود.اگر مشکلی با زمانبندی پیدا کردید، ممکن است دلایل مختلفی برای آن وجود داشته باشد.برچسب های زمانی صفر تنها یک دلیل ممکن است. در اینجا یکی از موارد زیر را بررسی می کنیم: پیکربندی زمانی اشتباه در هنگام وارد کردن اطلاعات. پیکربندی الگوی زمانبندی اشتباههنگامی که یک فایل CSV یا اکسل را به Disco وارد میکنید، الگوی زمانبندی به طور معمول به طور خودکار شناسایی می شود. شما مجبور نیستید کاری انجام دهید اگر به طور خودکار شناسایی نشود، Disco به شما اجازه می دهد مشخص کنید که چگونه الگوی زمان بندی باید تفسیر شود تا شما را مجبور کند که داده های منبع خود را به یک فرمت زمان بندی مشخص تبدیل کنید. و شما حتی می توانید با الگوهای مختلف زمان بندی در مجموعه داده های خود کار کنید.با این حال، اگر متوجه شدید که فعالیت ها در  روند اشتباهی نشان داده می شوند، یا اگر متوجه شوید که نقشه فرایند شما عجیب و غریب است و واقعا روند مورد انتظار را نشان نمی دهد، لازم است که نوع برچسب های زمانی در هنگام وارد کردن به درستی پیکربندی شوند.شما می توانید این کار را با رفتن به صفحه Import انجام دهید: بر روی دکمه ‘Reload’ از نمایش پروژه کلیک کنید یا داده های خود را دوباره وارد کنید. سپس ستون زمان بندی را انتخاب کنید و دکمه «الگوی …» را در گوشه سمت راست بالا فشار دهید. شما چند نشانه زمانی اولیه را در فایل خود (در سمت چپ) و پیش نمایش نحوه تفسیر آنها در دسکتاپ (در سبز، در سمت راست) مشاهده خواهید کرد.

ستون سبز را چک کنید که آیا علامت های زمانی به طور صحیح تفسیر شده اند. توجه به حروف کوچک و بزرگ حروف الگوی، به این دلیل که تفاوت می کنند،بسیار مهم است. به عنوان مثال، حروف کوچک ‘m’ برای دقیقه معادل است، در حالی که حروف بزرگ ‘M’ برای ماه ها است.

پیکربندی اشتباه  ستون Timestamp

 یکی دیگر از مشکلات زمانبندی که می تواند از اشتباهات در مرحله وارد کردن اطلاعات رخ دهد شود این است که شما ممکن است بعضی از ستون ها را بعنوان یک نشانه زمانی مشخص پیکربندی کنید که در واقع یک نشانه زمانی است که به معنای نشانه زمان تولید فرآیند است ( برای مثال، تاریخ تولد مشتری).در مثال بازپرداخت خدمات مشتری زیر، تاریخ خرید در داده ها به صورت یک نشانه زمانی است. با این حال، این یک تاریخ است که با گذشت زمان تغییر نمی کند و باید در واقع به عنوان یک ویژگی شناخته شود. شما می توانید ببینید که هر دو ‘برچسب زمانی کامل’ [4] و همچنین ‘تاریخ خرید’ [5] نماد ساعت در هدر، نشان می دهد که در حال حاضر هر دو به عنوان یک نشانه زمانی پیکربندی شده است.

اگر ستون ها به صورت یک نشانه زمانی نادرست پیکربندی شوند، Disco از آنها برای محاسبه مدت فعالیت استفاده می کند. به عنوان یک نتیجه، فعالیت ها می توانند به نادرست به صورت موازی نشان داده شوند، اگر چه در حقیقت در همان زمان اتفاق نمی افتد.برای مثال، در مجموعه داده خدمات مشتری، پیکربندی ستون «تاریخ خرید» را به یک ویژگی عادی تغییر می دهد که در زیر نشان داده شده است.

نویسنده: خانم Anne Rozinat
مرجع خبر:

http://fluxicon.com/blog/2016/03/data-quality-problems-in-process-mining-and-what-to-do-about-them-part-4-wrong-timestamp-configuration

 

 

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقایسه
علاقه مندی ها 0