تبدیلات فرایندکاوی – بخش ۵ :تکرارها را حذف کنید.

این پنجمین مقاله از سریهای منتشر شده ، در زمینه فعالیتهای معمول برای آمادهسازی دادههای فرایندکاوی میباشد.
در تحلیل فرایندکاوی، انواع مختلف، می توانند شاخص جالبی برای تشخیص رفتارهای مشترک و استثنایی باشند. با این وجود، برای تجزیه و تحلیل انواع مختلف به روشی معنیدار، باید داده ها را در سطح مناسب انتزاع قرار دهیم.
در مقاله قبلی پیرامون مشخص نمودن فعالیت ها، نشان داده شده است که چگونه میتوان هر تکرار یا یک فعالیت تکراری را مشخص نمود. افزودن این جزئیات اضافی برای پاسخگویی به سؤالات پیرامون تعداد دفعات تکرار و تجزیه و تحلیل آنها با جزئیات بیشتر مفید بوده است. اما می توان شرایطی به وجود آورد که در آن هدف رهایی از تکرارها باشد.
نگاهی به مثال زیر از چالش “2016 BPI ” بیندازید. مجموعه داده ها شامل مراکزی است که افراد برای اعمال مزایای بیکاری دنبال می کنند. هر مرحله کلیک بر روی وب سایت آژانس مزایای بیکاری است.
آنچه در این نقشه فرآیند مشاهده می کنید اینست که تعداد زیادی از حلقه های شخصی وجود دارد (که با مربعهای قرمز در تصویر فوق نشان داده شده است). این تکرارها با چند کلیک در همان صفحه وب انجام می شود. همچنین می توانند از یک نوسازی، تغییر مسیر خودکار یا یک پست داخلی به همان صفحه برگردند.
بنابراین، آنها ماهیت فنی تری نسبت به یک تکرار واقعی در همان مرحله فرآیند، دارند.در نتیجه، این تکرارها به منظور تحلیل تجربیات واقعی مشتری، برای این فرایند معنیدار نیست. بدتر از آن اینکه این تکرارها، تعداد زیادی از متغیرهای دیگر را، نسبت به آنچه که در واقعیت از فرایندهای سطح بالا حاصل میشوند، ایجاد می کنند.
به عنوان مثال، هنگامی که به نقشه فرایند در قسمت فوق توجه میکنید، مشاهده مینمایید که یک مسیر غالب در فرایند وجود دارد (که با پیکان ضخیم نشان داده شده است). با این حال، هنگامی که به نمونه فرایند های جداگانه توجه میشود (تصویر زیر را مشاهده نمایید)، فقط 158 نوع متفاوت برای 161 نمونه فرایند وجود دارد.
تنها نوع 1 و 2 نمونه فرایند مشابه دارند و به سرعت میتوانید دلیل آن را مشاهده کنید: بسیاری از تکرارها، انواع منحصر به فرد را با تعداد متفاوتی از تکرارها ایجاد میکنند. برای مثال، نمونه فرایند انتخاب شده، “1903105”، از 12 تکرار مرحله فرایند “Your last employer” برخوردار است. این مورد از تعداد کلیکهایی حاصل میگردد که کاربر، برای پر کردن فرم در این صفحه انجام داده است. در صورتی که متقاضی دیگر، یک مرتبه بیشتر یا کمتر بر روی این صفحه کلیک کند، این دو مورد به سرعت در دو نوع جداگانه قرار میگیرند.
با این وجود روشی برای گسترش دادهها به گونه ای وجود دارد که میتوانید انواع معنیدارتری را تحلیل کنید. در این مقاله، چگونگی این مسئله نشان داده شده است.
آنچه که باید انجام دهید این است که روی مراحل متفاوت در فرایند تمرکز کنید. برای مثال، هنگامی که بر روی جدول تاریخچه نمونه فرایند مربوط به نمونه “1903105” نشان داده شده در قسمت فوق کلیک راست میکنید، میتوانید تاریخچه این نمونه فرایند را از طریق گزینه ” Export as CSV…” ذخیره کنید. وقتی این کار را برای نمونه فرایند “2130597” انجام دهید و هر دوی آنها را در اکسل باز کنید، میتوان مراحلی که قصد مقایسه آن را دارید مشخص کنید. (به تصویر زیر مراجعه کنید).
همان گونه که مشاهده می کنید، اگر به داده های سطح دقیق نگاه کنید، هر دو نمونه فرایند “1903105” و “2137597” از یک الگوی متفاوت پیروی می کنند. با این حال، می توان استدلال کرد که آیا آنها واقعاً از نظر تجربه مشتری متفاوت هستند. هنگامی که تنها اولین وقوع رویداد را مدنظر قرار میدهید (که به رنگ سبز نشان داده شده است) مشاهده خواهید کرد که هر دو نمونه فرایند در واقع از توالی مشابهی در فرایند پیروی میکنند.
تکرارها تفاوتهای گستردهای را نشان میدهند که با دیدگاه سطح بالای این فرایندها ارتباط ندارد. به این ترتیب، میتوان به نحوی عمل کرد تا این تکرارها را از تحلیل حذف کنید. این کار را به شکل غیرتهاجمی با افزودن یک ستون اضافی انجام داده شده است که نشان میدهد آیا یک رویداد، تکرار است یا تکرار نیست.
مرحله 1: دادههای خود را با دیدگاه درست صادر کنید.
برای اکثر فرایندها، بسته به نحوه پیکربندی شناسه فرایند، نام فعالیت و برچسب زمان در مرحله ورود، می توانید چندین دیدگاه را در نظر بگیرید. از آن جا که تفسیر فعالیتهای تکرار شونده به دیدگاه فعلی شما بستگی دارد، میتوانید به سادهترین شکل ممکن، دادههای خود را از “Disco” به عنوان یک فایل “CSV” صادر کنید. مشاهده خواهید کرد که فایل “CSV” صادر شده، شامل ستونهای شناسه فرایند، فعالیت و برچسب زمان میباشد و به شکلی ارائه شده است که قبلاً آنها را در ورود دادهها طبقه بندی کردهاید (هنگامی که چندین ستون به عنوان شناسه فرایند یا فعالیت انتخاب شدهاند، میتوان آنها را از یکدیگر متمایز ساخت).
مرحله 2: داده های خود را تبدیل کنید.
برای تعیین رویدادهای تکرار شونده، از نسخه پایتون زیر استفاده کرده ام (کد زیر را مشاهده نمایید و یا نسخه موجود را بارگیری کنید). این نسخه در تمامی رویدادها برای تمامی نمونه فرایند ها ارائه میگردد. ارزیابی می کند که آیا رویداد فوق، مشابه بوده و یک ستون تکرار را با “TRUE” (هنگامی که فعالیت مشابه است) یا ” FALSE” (در تمامی موارد دیگر) اضافه میکند. کتابخانه پانداس (https://pandas.pydata.org) برای تکرار در تمامی رویدادها استفاده شده است. با این حال، میتوانید رویکرد مشابهی را در هر زبان برنامهریزی یا زبان پرس و جو موردنظر خود، انتخاب نمایید.
بهروزرسانی: برای یادگیری چگونگی تبدیل داده های خود به جای استفاده از پایتون در اکسل، به مقاله با عنوان حذف تکرارها با استفاده از اکسل مراجعه کنید.
نتیجه، یک فایل “CSV” است که شامل ستون تکرار جدید میباشد. هنگام ورود این فایل “CSV” جدید به”Disco”، میتوانید این ستون را به عنوان یک ویژگی دیگر علامتگذاری کنید، به نحوی که میتوان از آن برای فیلترسازی در مرحله بعد استفاده نمود (تصویر زیر را مشاهده نمایید).
پس از وارد کردن این مجموعه داده جدید، نقشه فرایند هنوز هم دقیقاً مشابه با نقشهای که در آغاز مشاهده کردید، میباشد (با تعداد زیادی خود-حلقه به دلیل تکرارهای زیاد).
مرحله 3: فعالیتهای تکراری را فیلتر کنید.
اگرچه، در شرایط موجود به سادگی میتوانیم رویدادهای تکراری را از تحلیل با کاربرد فیلتر ویژگی (به تصویر زیر مراجعه کنید)، حذف کنیم. این مورد تنها اولین وقوع توالی از فعالیتهای تکرار شونده را حفظ می کند که دقیقاً، رویدادهای سبز در مقایسه اکسل فوق میباشد.
با کشیدن هر دو فعالیت و مسیرهای کشویی در نقشه فرایند، اکنون می توانیم مشاهده کنیم که تمام حلقه های خود تکرار ناپدید شده اند (به تصویر زیر مراجعه کنید).
علاوه بر این، هنگامی که انواع مختلف را در برگه “Cases” بررسی می کنیم، می بینیم که تغییرات در مجموعه داده ها کاهش یافته است (به تصویر زیر مراجعه کنید). در حال حاضر 161 نمونه فرایند از 65 نوع مختلف پیروی می کنند و به 1 نوع غالب تبدیل شده است که 44.1 درصد از کل نمونه فرایند ها را در بر می گیرد.
نوع غالب اکنون توصیف رفتار مورد انتظار است. با مجموعه داده های ساده، انواع مختلف در سطح مناسب قرار دارند تا آنچه را که در مورد نمونه فرایند هایی که از این الگوی فرایند مورد انتظار انحراف دارند اتفاق می افتد، تجزیه و تحلیل کنند.
با مجموعه دادهای فیلتر شده، میتوانیم دوبارهکاری را در فرایند، بدون اختلال با تکرارهایی تحلیل کنیم که در همان صفحه مشاهده شده است. در این جا دو مثال ارائه شده است که شامل این موارد میباشد:
سؤال 1: چند مرتبه متقاضیان به مرحله اولیه فرایند باز می گردند؟
اگر متقاضیان به ابتدای فرآیند برگردند، این بدان معنی است که آنها درخواست خود را به تعویق می اندازند تا زمان لازم برای یافتن اطلاعات لازم را داشته باشند. آنها سؤالات مطرح شده را درک نکرده و یا زمان کافی برای تکمیل درخواست خود را ندارند. فیلترسازی این نمونه فرایند ها را میتوان با استفاده از “Follower filter” در “Disco” انجام داد که در تصویر زیر نشان داده شده است.
55% نمونه فرایند ها که از نوع غالب پیروی نمی کنند، شامل این الگو میباشد. در نقشه فرایند زیر مشاهده میگردد که برای 50 نمونه فرایند بازگشت داده شده به شروع فرایند، 28 مورد (بیش از نیمی) پس از مرحله “ارسال دادهها” باز پس فرستاده میشوند که به طور بالقوه منجر به ارسال مجدد برناهه می شوند.
سؤال 2: چه اتفاقی میافتد وقتی برنامه مجدداً اجرا می شود؟
برای تجزیه و تحلیل جزئیات بیشتر چه اتفاقی می افتد هنگام ارسال مجدد برنامه، در آغاز باید تمامی درخواستها را در موقعیتی فیلتر کنیم که در آن، مرحله “ارسال دادهها” مجدداً رخ داده است (تصویر زیر را مشاهده نمایید).
برای تمرکز بر بخش ارسال مجدد واقعی، باید آنچه را که پس از اولین رخداد مرحله “ارسال دادهها” اتفاق میافتد، تجزیه و تحلیل کنیم. بدین منظور، میتوانیم یک فیلتر “Endpoints” را با گزینه “Trim longest” برای حذف تمامی مراحل پس از اولین وقوع “ارسال دادهها” اضافه کنید (قسمت زیر را مشاهده کنید).
اکنون می توانیم تحلیل کنیم که پس از ارسال درخواست برای اولین بار کدام صفحات مورد بررسی مجدد قرار گرفته اند (به قسمت زیر مراجعه کنید).
مزیت رویکرد توصیف شده در این مقاله – افزودن یک ویژگی برای فیلتر کردن تکرارها و نه حذف رویدادهای تکراری از مجموعه دادهها – این است که میتوانید دادههای اصلی را حفظ و فرایند را در سطح دقیقتر تجزیه وتحلیل کنید و همچنین تمام مراحل نیز مطرح میباشد. برای مثال، شاید برخی از مراحل فرایند وجود داشته باشد که برای آنها بخواهید توالی مرحله کلیک دقیق را در صفحه، در مرحله دوم تحلیل نمایید.
در پایان، دو مورد باید هنگام حذف تکرار از مجموعه دادهها به خاطر سپرده شود:
1- در صورتی که فرایند را از نقطه نظرهای گوناگون تحلیل می کنید (مرحله 1 را در قسمت فوق مشاهده کنید)، باید از مراحل تبدیلات توصیف شده در این مقاله برای هر کدام از این دیدگاه ها استفاده نمایید.
2- در صورتی که فعالیتها را برای ساده کردن فرایند با استراتژی سادهسازی “Milestone” (و یا کاربرد برخی از فیلترهای دیگر که رویداد را حذف میکنند) پس از افزودن ویژگی تکرار حذف کنید، این عمل میتواند تکرارهای جدیدی را ایجاد کند که قبلاً این گونه نبوده است. برای حذف این تکرارهای جدید، باید
مجدداً به مرحله 1 وارد شوید و فرایند را تکرار کنید.
مرجع