قوانین فنی رویداد
مجموعه قوانین فنی رویداد بازشناسی چهره فیس کاپ به قرار زیر است.
مقدمه
دنیا به سرعت در حال تکامل است و با پیشرفت تکنولوژیهای مرتبط با هوش مصنوعی، تولید و شناسایی دیپفیک (Deepfake) تبدیل به یک چالش فوری و حیاتی شده است. دیپفیکها ویدیوهایی هستند که با استفاده از الگوریتمهای یادگیری عمیق و هوش مصنوعی ساخته میشوند و افراد را به نحوی به نمایش میگذارند که آنها به نظر میآیند که چیزی انجام میدهند یا چیزهایی میگویند که در واقعیت انجام ندادهاند. این تکنولوژی با ایجاد ویدیوهای واقعگرایانه که میتواند افراد را به تعبیر متفاوتی نشان دهد، پتانسیل زیادی برای سوءاستفاده دارد و میتواند تأثیر زیادی بر روی جامعه و جریانهای اطلاعاتی داشته باشد.
هدف نهایی در این مسابقه پیادهسازی یک سیستم تشخیص ویدیوهای Deepfake است که در آن ویدئوهای جعلی از غیر جعلی تشخیص داده خواهند شد. در ادامه توضیحاتی در مورد مجموعهدادگان، قوانین اجرائی و فنی مسابقه و نحوه تولید خروجیهای مطلوب آورده شده است.
مجموعهدادگان
مجموعه دادگان رویداد فیسکاپ تعدادی ویدئوی دارای چهره است. در مجموعهدادگان ارائه شده تا حد امکان تمام چالشهای موجود در زمینه احراز هویت وجود دارد. مجموعهدادگان شامل افراد ایرانی و غیرایرانی بوده و گوناگونی در مواردی مانند جهت زاویه سر [Pose]، وضعیت نورپردازی [Illumination]، حالت چهره، سن،جنسیت، حجاب اسلامی وجود دارد.
برای آموزش میتوانید از دیتاستهای عمومی مثل Kaggle استفاده کنید.
https://www.kaggle.com/c/deepfake-detection-challenge/data
قوانین اجرائی
برای شرکت در مسابقه، هر تیم شرکتکننده میبایست کد خود را با توجه به قالب فایلهای ورودی و خروجی که در ادامه شرح داده شده است تهیه نموده و برنامهی اجرائی خود را در قالب یک فولدر تحویل و در زمان مقرر در وب سایت مسابقه بارگذاری نماید. کد ارسال شده باید قابلیت تبدیل به داکر ایمیج را داشته باشد. بعد از دریافت کد، کد به ایمیج تبدیل شده و بر روی سیستمی که مجموعهدادگان ارائه شده بر روی آن قرار دارد اجرا میشود و پس از اجرای کامل برنامه، فایل خروجی دریافت و داکر ایمیج پاک میشود. لازم به ذکر است که در بازهی زمانی اعلام شده، شرکتکنندگان میتوانند اقدام به بارگذاری کد خود نموده، سپس نتایج و امتیاز نهایی هر تیم با توجه به معیارهایی که در ادامه آورده شده است، محاسبه شده و به اطلاع شرکتکنندگان خواهد رسید. شرکتکنندگان میتوانند کدهای خود را به تعداد نامحدود بروزرسانی نموده و مجدداً بارگذاری نمایند. این روال تا اتمام بازهی زمانی مورد نظر ادامه خواهد داشت و پس از اتمام زمان، داوری نهایی مطابق با آخرین کد بروزرسانی شده به ازای هر تیم انجام خواهد شد. بازههای زمانی مورد نظر و تعداد مجاز آپلود کد متعاقباً از طریق وبسایت مسابقه اعلام خواهند شد.
به منظور آموزش چگونگی ساخت و اجرای داکر ایمیج، فایل راهنما در سایت قرار خواهد گرفت.
پوشه ارسالی شرکت کننده
شرکت کننده پوشهای به نام DeepFake ایجاد کرده و کدهای خود را به همراه داکرفایل درون آن قرار میدهد.
قالب فایل ورودی
ویدیوهای ورودی در درون پوشهای به نام input که درون پوشه DeepFake اضافه میشود قرار دارند. به عبارت دیگر پوشه input نسبت به مسیر کد در مسیر زیر قرار دارد:
./input
برنامه میبایست ویدئوهای موجود در این آدرس را خوانده و عملیات تشخیص ویدیوهای جعلی را انجام دهد و در نهایت فایل خروجی را در قالب بیان شده در قسمت بعد تولید نماید.
قالب فایل خروجی
یک فایل خروجی با نام submission و با فرمت .csv که شامل 2 ستون به شرح زیر است، تولید میشود:
- ستون اول: نام فایل ویدئو
- ستون دوم: احتمال جعلی بودن
به طور مثال:
filename,label
10000.mp4,0.2
10001.mp4,0.8
10002.mp4,0.5
تذکر1: به ازای هر ویدیو باید یک سطر در فایل خروجی وجود داشته باشد.
تذکر2: شرکت کننده باید کد را به گونهای پیادهسازی کند که قابلیت مدیریت خطاهای احتمالی را داشته باشد. در صورتی که کد با هر گونه خطایی مواجه شود و خروجی فایل csv را تولید نکند، وارد مرحله ارزیابی نخواهد شد.
تذکر3: کد ارسالی شرکت کننده باید فاقد پوشه input و output باشد.
تذکر۴: فایل تولید شده حتما به نام submission.csv در مسیر زیر ذخیره شود.
./output
نحوه محاسبه امتیاز نهایی:
سیستم امتیازدهی برای ارسالها در این مسابقه بر اساس معیار “log loss” است. در ادامه فرمول این معیار را مشاهده میکنید:
که در اینجا:
- “n” تعداد ویدیوهایی است که قرار است پیشبینی شوند.
- “ŷi ” احتمال پیشبینی شده fake (غیر واقعی) بودن ویدیوی i-ام است.
- “yi” یک متغیر باینری است که اگر ویدیوی i-ام fake باشد مقدار 1 و اگر ویدیو واقعی باشد مقدار ۰ دارد.
تذکر۵:الگوریتم باید بتواند با سخت افزار ارائه شده قابل اجرا باشد. مشخصات سخت افزار مورد استفاده متعاقباً اعلام خواهد شد.
تذکر۶: در صورتی که زمان اجرای الگوریتم بیشتر از 3 ساعت باشد، اجرا متوقف خواهد شد و امتیازی به شرکتکننده تعلق نخواهد گرفت.
تذکر7: جهت دانلود فایل یا مدل از اینترنت، حتما توجه شود در Dockerfile این موارد آورده شوند، بعد از آنکه dockerfile ساخته می شود هیچ دسترسی به اینترنت وجود ندارد. برای مثال: اگر جهت استنتاج نیاز به دانلود Model.pth دارید در Dockerfile به این صورت قرار دهید.
Wget URL/model.pth