قوانین فنی رویداد

مجموعه قوانین فنی رویداد بازشناسی چهره فیس کاپ به قرار زیر است.

مقدمه

دنیا  به سرعت در حال تکامل است و با پیشرفت تکنولوژی‌های مرتبط با هوش مصنوعی، تولید و شناسایی دیپ‌فیک (Deepfake) تبدیل به یک چالش فوری و حیاتی شده است. دیپ‌فیک‌ها ویدیوهایی هستند که با استفاده از الگوریتم‌های یادگیری عمیق و هوش مصنوعی ساخته می‌شوند و افراد را به نحوی به نمایش می‌گذارند که آنها به نظر می‌آیند که چیزی انجام می‌دهند یا چیزهایی می‌گویند که در واقعیت انجام نداده‌اند. این تکنولوژی با ایجاد ویدیوهای واقع‌گرایانه که می‌تواند افراد را به تعبیر متفاوتی نشان دهد، پتانسیل زیادی برای سوءاستفاده دارد و می‌تواند تأثیر زیادی بر روی جامعه و جریان‌های اطلاعاتی داشته باشد.

هدف نهایی در این مسابقه پیاده‌سازی یک سیستم تشخیص ویدیوهای Deepfake است که در آن ویدئوهای جعلی از غیر جعلی تشخیص داده خواهند شد. در ادامه توضیحاتی در مورد مجموعه‌دادگان، قوانین اجرائی و فنی مسابقه و نحوه تولید خروجی‌های مطلوب آورده شده است.

مجموعه‌دادگان

مجموعه دادگان رویداد فیس‌کاپ تعدادی ویدئوی دارای چهره است. در مجموعه‌دادگان ارائه شده تا حد امکان تمام چالش‌های موجود در زمینه احراز هویت وجود دارد. مجموعه‌دادگان شامل افراد ایرانی و غیرایرانی بوده و گوناگونی در مواردی مانند جهت زاویه سر [Pose]، وضعیت نورپردازی [Illumination]، حالت چهره، سن،جنسیت، حجاب اسلامی وجود دارد.

برای آموزش می­توانید از دیتاست­های عمومی مثل Kaggle استفاده کنید.

https://www.kaggle.com/c/deepfake-detection-challenge/data

قوانین اجرائی

برای شرکت در مسابقه، هر تیم شرکت‌کننده می‌بایست کد خود را با توجه به قالب فایل‌های ورودی و خروجی که در ادامه شرح داده شده است تهیه نموده و برنامه‌ی اجرائی خود را در قالب یک فولدر تحویل و در زمان مقرر در وب سایت مسابقه بارگذاری نماید. کد ارسال شده باید قابلیت تبدیل به داکر ایمیج را داشته باشد. بعد از دریافت کد، کد به ایمیج تبدیل شده و بر روی سیستمی که مجموعه‌دادگان ارائه شده بر روی آن قرار دارد اجرا می‌شود و پس از اجرای کامل برنامه، فایل خروجی دریافت و داکر ایمیج پاک می‌شود. لازم به ذکر است که در بازه‌ی زمانی اعلام شده، شرکت‌کنندگان می‌توانند اقدام به بارگذاری کد خود نموده، سپس نتایج و امتیاز نهایی هر تیم با توجه به معیارهایی که در ادامه آورده شده است، محاسبه شده و به اطلاع شرکت‌کنندگان خواهد رسید. شرکت‌کنندگان می‌توانند کدهای خود را به تعداد نامحدود بروزرسانی نموده و مجدداً بارگذاری نمایند. این روال تا اتمام بازه‌ی زمانی مورد نظر ادامه خواهد داشت و پس از اتمام زمان، داوری نهایی مطابق با آخرین کد بروزرسانی شده به ازای هر تیم انجام خواهد شد. بازه‌های زمانی مورد نظر و تعداد مجاز آپلود کد متعاقباً از طریق وب‌‏سایت مسابقه اعلام خواهند شد.

به منظور آموزش چگونگی ساخت و اجرای داکر ایمیج، فایل راهنما در سایت قرار خواهد گرفت.

پوشه ارسالی شرکت کننده

شرکت کننده پوشه‌ای به نام DeepFake ایجاد کرده و کدهای خود را به همراه داکرفایل درون آن قرار می‌دهد.

قالب فایل ورودی

ویدیوهای ورودی در درون پوشه‌ای به نام input که درون پوشه DeepFake اضافه می‌شود قرار دارند. به عبارت دیگر پوشه input نسبت به مسیر کد در مسیر زیر قرار دارد:

./input

برنامه می‌بایست ویدئوهای موجود در این آدرس را خوانده و عملیات تشخیص ویدیوهای جعلی را انجام دهد و در نهایت فایل خروجی را در قالب بیان شده در قسمت بعد تولید نماید.

قالب فایل خروجی

یک فایل خروجی با نام submission و با فرمت .csv که شامل 2 ستون به شرح زیر است، تولید می‌شود:

  • ستون اول: نام فایل ویدئو
  • ستون دوم: احتمال جعلی بودن

به طور مثال:

filename,label

10000.mp4,0.2

10001.mp4,0.8

10002.mp4,0.5

تذکر1: به ازای هر ویدیو باید یک سطر در فایل خروجی وجود داشته باشد.

تذکر2: شرکت کننده باید کد را به گونه‌ای پیاده‌سازی کند که قابلیت مدیریت خطاهای احتمالی را داشته باشد. در صورتی که کد با هر گونه خطایی مواجه شود و خروجی فایل csv را تولید نکند، وارد مرحله ارزیابی نخواهد شد.

تذکر3: کد ارسالی شرکت کننده باید فاقد پوشه input و output باشد.

تذکر۴: فایل تولید شده حتما به نام submission.csv در مسیر زیر ذخیره شود.

./output

 

نحوه محاسبه امتیاز نهایی:

سیستم امتیازدهی برای ارسال‌ها در این مسابقه بر اساس معیار “log loss” است. در ادامه فرمول این معیار را مشاهده می‌کنید:

 

که در اینجا:

  • “n” تعداد ویدیوهایی است که قرار است پیش‌بینی شوند.
  • “ŷi ” احتمال پیش‌بینی شده fake (غیر واقعی) بودن ویدیوی i-ام است.
  • “yi” یک متغیر باینری است که اگر ویدیوی i-ام fake باشد مقدار 1 و اگر ویدیو واقعی باشد مقدار ۰ دارد.

تذکر۵:الگوریتم باید بتواند با سخت افزار ارائه شده قابل اجرا باشد. مشخصات سخت افزار مورد استفاده متعاقباً اعلام خواهد شد.

تذکر۶: در صورتی که زمان اجرای الگوریتم بیشتر از 3 ساعت باشد، اجرا متوقف خواهد شد و امتیازی به شرکت‌کننده تعلق نخواهد گرفت.

تذکر7: جهت دانلود فایل یا مدل از اینترنت، حتما توجه شود در Dockerfile این موارد آورده شوند، بعد از آنکه dockerfile ساخته می شود هیچ دسترسی به اینترنت وجود ندارد. برای مثال: اگر جهت استنتاج نیاز به دانلود Model.pth دارید در Dockerfile به این صورت قرار دهید.

Wget URL/model.pth