تبدیلات فرایندکاوی – بخش ۵ :تکرارها را حذف کنید.

تبدیلات فرایندکاوی – بخش ۵ :تکرارها را حذف کنید.

این پنجمین مقاله از سری‌های منتشر شده ، در زمینه فعالیت‌های معمول برای آماده‌سازی داده‌های فرایندکاوی می‌باشد.

در تحلیل فرایندکاوی، انواع مختلف، می توانند شاخص جالبی برای تشخیص رفتارهای مشترک و استثنایی ‌باشند. با این وجود، برای تجزیه و تحلیل انواع مختلف به روشی معنی‌دار، باید داده ها را در سطح مناسب انتزاع قرار دهیم.

در مقاله قبلی پیرامون مشخص نمودن فعالیت ها، ‌نشان داده شده است که چگونه می‌توان هر تکرار یا یک فعالیت تکراری را مشخص نمود. افزودن این جزئیات اضافی برای پاسخگویی به سؤالات پیرامون تعداد دفعات تکرار و تجزیه و تحلیل آن‌ها با جزئیات بیشتر مفید بوده است. اما می توان شرایطی به وجود آورد که در آن هدف رهایی از تکرارها باشد.

نگاهی به مثال زیر از چالش “2016 BPI ” بیندازید. مجموعه داده ها شامل مراکزی است که افراد برای اعمال مزایای بیکاری دنبال می کنند. هر مرحله کلیک بر روی وب سایت آژانس مزایای بیکاری است.

آنچه در این نقشه فرآیند مشاهده می کنید اینست که تعداد زیادی از حلقه های شخصی وجود دارد (که با مربع‌های قرمز در تصویر فوق نشان داده شده است). این تکرارها با چند کلیک در همان صفحه وب انجام می شود. همچنین می توانند از یک نوسازی، تغییر مسیر خودکار یا یک پست داخلی به همان صفحه برگردند.

بنابراین، آنها ماهیت فنی تری نسبت به یک تکرار واقعی در همان مرحله فرآیند، دارند.در نتیجه، این تکرارها به منظور تحلیل تجربیات واقعی مشتری، برای این فرایند معنی‌دار نیست. بدتر از آن اینکه این تکرارها، تعداد زیادی از متغیرهای دیگر را، نسبت به آنچه که در واقعیت از فرایندهای سطح بالا حاصل می‌شوند، ایجاد می کنند.

به عنوان مثال، هنگامی که به نقشه فرایند در قسمت فوق توجه می‌کنید، مشاهده می‌نمایید که یک مسیر غالب در فرایند وجود دارد (که با پیکان ضخیم نشان داده شده است). با این حال، هنگامی که به نمونه فرایند های جداگانه توجه می‌شود (تصویر زیر را مشاهده نمایید)، فقط 158 نوع متفاوت برای 161 نمونه فرایند وجود دارد.

تنها نوع 1 و 2 نمونه فرایند مشابه دارند و به سرعت می‌توانید دلیل آن را مشاهده کنید: بسیاری از تکرارها، انواع منحصر به فرد را با تعداد متفاوتی از تکرارها ایجاد می‌کنند. برای مثال، نمونه فرایند انتخاب شده، “1903105”، از 12 تکرار مرحله فرایند “Your last employer” برخوردار است. این مورد از تعداد کلیک‌هایی حاصل می‌گردد که کاربر، برای پر کردن فرم در این صفحه انجام داده است. در صورتی که متقاضی دیگر، یک مرتبه بیشتر یا کمتر بر روی این صفحه کلیک کند، این دو مورد به سرعت در دو نوع جداگانه قرار می‌گیرند.

با این وجود روشی برای گسترش داده‌ها به گونه ای وجود دارد که می‌توانید انواع معنی‌دارتری را تحلیل کنید. در این مقاله، چگونگی این مسئله نشان داده شده است.

آنچه که باید انجام دهید این است که روی مراحل متفاوت در فرایند تمرکز کنید. برای مثال، ‌هنگامی که بر روی جدول تاریخچه نمونه فرایند مربوط به نمونه “1903105” نشان داده شده در قسمت فوق کلیک راست می‌کنید، می‌توانید تاریخچه این نمونه فرایند را از طریق گزینه ” Export as CSV…” ذخیره کنید. وقتی این کار را برای نمونه فرایند “2130597” انجام ‌دهید و هر دوی آن‌ها را در اکسل باز ‌کنید، می‌توان مراحلی که قصد مقایسه آن را دارید مشخص کنید. (به تصویر زیر مراجعه کنید).

همان گونه که مشاهده می کنید، اگر به داده های سطح دقیق نگاه کنید، هر دو نمونه فرایند “1903105” و “2137597” از یک الگوی متفاوت پیروی می کنند. با این حال، می توان استدلال کرد که آیا آنها واقعاً از نظر تجربه مشتری متفاوت هستند. هنگامی که تنها اولین وقوع رویداد را مدنظر قرار می‌دهید (که به رنگ سبز نشان داده شده است) مشاهده خواهید کرد که هر دو نمونه فرایند در واقع از توالی مشابهی در فرایند پیروی می‌کنند.

تکرارها تفاوت‌های گسترده‌ای را نشان می‌دهند که با دیدگاه سطح بالای این فرایندها ارتباط ندارد. به این ترتیب، می‌توان به نحوی عمل کرد تا این تکرارها را از تحلیل حذف کنید. این کار را به شکل غیرتهاجمی با افزودن یک ستون اضافی انجام داده‌ شده است که نشان می‌دهد آیا یک رویداد، تکرار است یا تکرار نیست.

مرحله 1: داده‌های خود را با دیدگاه درست صادر کنید.

برای اکثر فرایندها، بسته به نحوه پیکربندی شناسه فرایند، نام فعالیت و برچسب زمان در مرحله ورود، می توانید چندین دیدگاه را در نظر بگیرید. از آن جا که تفسیر فعالیت‌های تکرار شونده به دیدگاه فعلی شما بستگی دارد، می‌توانید به ساده‌ترین شکل ممکن، ‌داده‌های خود را از “Disco” به عنوان یک فایل “CSV”  صادر کنید. مشاهده خواهید کرد که فایل “CSV”  صادر شده، شامل ستون‌های شناسه فرایند، فعالیت و برچسب زمان می‌باشد و به شکلی ارائه شده است که قبلاً آن‌ها را در ورود داده‌ها طبقه بندی کرده‌اید (هنگامی که چندین ستون به عنوان شناسه فرایند یا فعالیت انتخاب شده‌اند، می‌توان آن‌ها را از یکدیگر متمایز ساخت).

مرحله 2: داده های خود را تبدیل کنید.

برای تعیین رویدادهای تکرار شونده، از نسخه پایتون زیر استفاده کرده ام (کد زیر را مشاهده نمایید و یا نسخه موجود را بارگیری کنید). این نسخه در تمامی رویدادها برای تمامی نمونه فرایند ها ارائه می‌گردد. ارزیابی می کند که آیا رویداد فوق، مشابه بوده و یک ستون تکرار را با “TRUE” (هنگامی که فعالیت مشابه است) یا ” FALSE” (در تمامی موارد دیگر) اضافه می‌کند. کتابخانه پانداس (https://pandas.pydata.org) برای تکرار در تمامی رویدادها استفاده شده است. با این حال، می‌توانید رویکرد مشابهی را در هر زبان برنامه‌ریزی یا زبان پرس و جو موردنظر خود، انتخاب نمایید.

به‌روزرسانی: برای یادگیری چگونگی تبدیل داده های خود به جای استفاده از پایتون در اکسل، به مقاله با عنوان حذف تکرارها با استفاده از اکسل مراجعه کنید.

نتیجه، یک فایل “CSV” است که شامل ستون تکرار جدید می‌باشد. هنگام ورود این فایل “CSV” جدید به”Disco”، می‌توانید این ستون را به عنوان یک ویژگی دیگر علامت‌گذاری کنید، به نحوی که می‌توان از آن برای فیلترسازی در مرحله بعد استفاده نمود (تصویر زیر را مشاهده نمایید).

پس از وارد کردن این مجموعه داده ‌جدید، نقشه فرایند هنوز هم دقیقاً مشابه با نقشه‌ای که در آغاز مشاهده کردید، می‌باشد (با تعداد زیادی خود-حلقه به دلیل تکرارهای زیاد).

مرحله 3: فعالیت‌های تکراری را فیلتر کنید.

اگرچه، در شرایط موجود به سادگی می‌توانیم رویدادهای تکراری را از تحلیل با کاربرد فیلتر ویژگی (به تصویر زیر مراجعه کنید)، حذف کنیم. این مورد تنها اولین وقوع توالی از فعالیت‌های تکرار شونده را حفظ می کند که دقیقاً، رویدادهای سبز در مقایسه اکسل فوق می‌باشد.

با کشیدن هر دو فعالیت و مسیرهای کشویی در نقشه فرایند، اکنون می توانیم مشاهده کنیم که تمام حلقه های خود تکرار ناپدید شده اند (به تصویر زیر مراجعه کنید).

علاوه بر این، هنگامی که انواع مختلف را در برگه “Cases” بررسی می کنیم، می بینیم که تغییرات در مجموعه داده ها کاهش یافته است (به تصویر زیر مراجعه کنید). در حال حاضر 161 نمونه فرایند از 65 نوع مختلف پیروی می کنند و به 1 نوع غالب تبدیل شده است که 44.1 درصد از کل نمونه فرایند ها را در بر می گیرد.

نوع غالب اکنون توصیف رفتار مورد انتظار است. با مجموعه داده های ساده، انواع مختلف در سطح مناسب قرار دارند تا آنچه را که در مورد نمونه فرایند هایی که از این الگوی فرایند مورد انتظار انحراف دارند اتفاق می افتد، تجزیه و تحلیل کنند.

مرحله 4: تجزیه و تحلیل فرایند

با مجموعه داد‌های فیلتر شده، می‌توانیم دوباره‌کاری را در فرایند، بدون اختلال با تکرارهایی تحلیل کنیم که در همان صفحه مشاهده شده است. در این جا دو مثال ارائه شده است که شامل این موارد می‌باشد:

سؤال 1: چند مرتبه متقاضیان به مرحله اولیه فرایند باز می گردند؟

اگر متقاضیان به ابتدای فرآیند برگردند، این بدان معنی است که آنها درخواست خود را به تعویق می اندازند تا زمان لازم برای یافتن اطلاعات لازم را داشته باشند. آن‌ها سؤالات مطرح شده را درک نکرده و یا زمان کافی برای تکمیل درخواست خود را ندارند. فیلترسازی این نمونه فرایند ها را می‌توان با استفاده از “Follower filter” در “Disco” انجام داد که در تصویر زیر نشان داده شده است.

55% نمونه فرایند ها که از نوع غالب پیروی نمی کنند، شامل این الگو می‌باشد. در نقشه فرایند زیر مشاهده می‌گردد که برای 50 نمونه فرایند بازگشت داده شده به شروع فرایند، 28 مورد (بیش از نیمی) پس از مرحله “ارسال داده‌ها” باز پس فرستاده می‌شوند که به طور بالقوه منجر به ارسال مجدد برناهه می‌ شوند.

سؤال 2: چه اتفاقی می‌افتد وقتی برنامه مجدداً اجرا می شود؟

برای تجزیه و تحلیل جزئیات بیشتر چه اتفاقی می افتد هنگام ارسال مجدد برنامه، در آغاز باید تمامی درخواست‌ها را در موقعیتی فیلتر کنیم که در آن، مرحله “ارسال داده‌ها” مجدداً رخ داده است (تصویر زیر را مشاهده نمایید).

برای تمرکز بر بخش ارسال مجدد واقعی، باید آنچه را که پس از اولین رخداد مرحله “ارسال داده‌ها” اتفاق می‌افتد، تجزیه و تحلیل کنیم. بدین منظور، می‌توانیم یک فیلتر “Endpoints” را با گزینه “Trim longest” برای حذف تمامی مراحل پس از اولین وقوع “ارسال داده‌ها” اضافه کنید (قسمت زیر را مشاهده کنید).

اکنون می توانیم تحلیل کنیم که پس از ارسال درخواست برای اولین بار کدام صفحات مورد بررسی مجدد قرار گرفته اند (به قسمت زیر مراجعه کنید).

مزیت رویکرد توصیف شده در این مقاله – افزودن یک ویژگی برای فیلتر کردن تکرارها و نه حذف رویدادهای تکراری از مجموعه داده‌ها – این است که می‌توانید داده‌های اصلی را حفظ و فرایند را در سطح دقیق‌تر تجزیه وتحلیل کنید و همچنین تمام مراحل نیز مطرح می‌باشد. برای مثال، شاید برخی از مراحل فرایند وجود داشته باشد که برای آن‌ها بخواهید توالی مرحله کلیک دقیق را در صفحه، در مرحله دوم تحلیل نمایید.

در پایان، دو مورد باید هنگام حذف تکرار از مجموعه داده‌ها به خاطر سپرده شود:

1- در صورتی که فرایند را از نقطه نظرهای گوناگون تحلیل می کنید (مرحله 1 را در قسمت فوق مشاهده کنید)، باید از مراحل تبدیلات توصیف شده در این مقاله برای هر کدام از این دیدگاه ها استفاده نمایید.

2- در صورتی که فعالیت‌ها را برای ساده کردن فرایند با استراتژی ساده‌سازی “Milestone” (و یا کاربرد برخی از فیلترهای دیگر که رویداد را حذف می‌کنند) پس از افزودن ویژگی تکرار حذف کنید، این عمل می‌تواند تکرارهای جدیدی را ایجاد کند که قبلاً این گونه نبوده است. برای حذف این تکرارهای جدید، باید

مجدداً به مرحله 1 وارد شوید و فرایند را تکرار کنید.

مرجع

 

 

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقایسه
علاقه مندی ها 0