چک لیست مناسب داده ها برای فرآیند استخراج

چک لیست مناسب داده ها برای فرآیند استخراج

   هنگامی که شروع به جستجوی داده های استخراج فرآیند در سازمان خود کردید ، با مجموعه داده هایی روبرو می شوید که باید تعیین کنید که آیا آنها مناسب برای استخراج فرآیند هستند یا نه.

      شاید شما یک گزارش موجود پیدا کرده اید و می خواهید ببینید که آیا این خلاصه (نتیجه) داده ها برای پروژه استخراج فرآیند شما قابل استفاده است یا خیر. یا شما مجموعه ای از داده ها را از بخش فناوری اطلاعات خود خواسته اید و اکنون باید قضاوت کنید که آیا شرایط لازم برای تجزیه و تحلیل فرآیند استخراج را برآورده می کند یا خیر.

      دقیقاً چه چیزی را باید جستجو کنید؟ در اینجا یک چک لیست با سؤالاتی وجود دارد که می توانید از طریق آن برای ارزیابی مناسب بودن داده های خود استفاده کنید. همچنین می توانید این نسخه PDF را بارگیری کنید تا آن را چاپ کرده و هر نقطه را بررسی کنید.

چک لیست داده های مناسب 

  1. داده های دارای ساختار اند؟ آیا داده هایی با ستون و سطر دارید؟
  1. ID Case ، Activity و Timestamp columns  در دسترس است؟ آیا حداقل یک ستون دارید که می تواند شناسه پرونده شما ، نام فعالیت شما و نشانگر زمانی شما باشد؟ ببینید چه موقع نشانگر زمانی مورد نیاز درلازم نیست.
  1. شناسه مشابه در چند ردیف دارید؟ آیا گاهی در یک ردیف چند مورد شناسه مشابه ظاهر می شود؟ اگر هر ردیف دارای یک شناسه پرونده منحصر به فرد باشد ، داده های شما قابل استفاده نیستند یا ممکن است نیاز به اصلاح مجدد آن داشته باشید.
  1. فعالیتهای مختلفی در یک مورد مشابه وجود دارد؟ آیا نام فعالیت حداقل در بعضی موارد تغییر می کند؟ اگر زمینه فعالیت با گذشت زمان تغییر نکند ، شامل تاریخ نمی شود و باید به دنبال ستون فعالیت دیگری باشید.
  1. نماهای زمانی مختلف در یک مورد وجود دارد؟ آیا نشانگر زمان حداقل در بعضی موارد تغییر می کند؟ اگر زمینه نشانگر زمانی به مرور زمان تغییر نکند ، شامل تاریخ نمی شود و نمی تواند از آن به عنوان ستون نشانگر زمانی استفاده شود. اگر قبلاً مرتب شده باشد می توانید داده های خود را بدون نشان های زمانی وارد کنید.
  1. تاریخ و ساعت در یک ستون قرار دارند؟ آیا تاریخ و زمان نشانگر زمانی شما در همان ستون قرار می گیرد؟ از آنجا که می توانید چندین نشانگر زمانی داشته باشید ، هر نشانگر زمانی باید در یک ستون باشد.
  1. داده ها در یک پرونده قرار دارند؟ اگر داده های شما در چندین فایل توزیع شده است (برای مثال ، چون از سیستم های مختلف IT تهیه شده است) ، آیا آن را در یک پرونده ترکیب کرده اید؟
  1. الگوهای مختلف جدول زمانی در ستون های جداگانه قراردارند؟ اگر دارای نشان های زمانی با الگوهای مختلف زمانی هستید ، آیا آنها در ستون های مختلف قرار می گیرند؟
  1. نام فعالیت قابل خواندن توسط انسان است(برای انسان معنا دارد)؟ آیا نام فعالیتهای شما قابل درک است (نه فقط یک مقدار عددی مانند یک کد عمل یا شماره ی یک تراکنش)؟
  1. نام فعالیت به اندازه کافی تعمیم یافته(کلی) است؟ آیا همین فعالیت در مورد دیگر دارای همان برچسب فعالیت است (نباید فقط یک فیلد متن آزاد باشد که هر بار متفاوت پر می شود)؟

https://fluxicon.com/blog/2020/04/data-suitability-checklist-for-process-mining/

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقایسه
علاقه مندی ها 0