هوش مصنوعی مکانی ایران(ایران ژئو آی)

همیشه یک چیز جدید برای یادگرفتن هست.

افزایش داده (Data Augmentation)

افزایش داده (Data Augmentation) در GeoAI: کیمیاگری با پیکسل‌ها

نویسنده: فاطمه جعفری نوبخت

در دنیای ایده‌آل هوش مصنوعی، ما به بی‌نهایت تصویر ماهواره‌ای برچسب‌خورد‌ه، با کیفیت بالا و در شرایط نوری مختلف دسترسی داریم. اما در دنیای واقعی، داده‌های مکانی (Geospatial Data) گران، کمیاب و گاهی ناقص هستند.

افزایش داده (Data Augmentation) هنر و علمِ تولید داده‌های آموزشی جدید از داده‌های موجود است. این تکنیک مانند یک باشگاه بدنسازی برای مدل‌های هوش مصنوعی عمل می‌کند؛ با ایجاد چالش‌های مصنوعی (مثل چرخاندن تصویر یا تغییر رنگ)، مدل را برای روبرو شدن با دنیای واقعی و خشن آماده می‌کند.

۱. چرا در GeoAI به افزایش داده نیاز مبرم داریم؟

برخلاف تشخیص چهره یا متن، داده‌های مکانی چالش‌های محیطی منحصر‌به‌فردی دارند:

  1. تنوع فصلی و نوری: یک جنگل در تابستان سبز و در پاییز زرد است. مدلی که فقط تابستان را دیده باشد، در پاییز کور می‌شود.
  2. چرخش‌پذیری: در عکس‌های معمولی (مثل عکس یک ماشین)، بالا و پایین تصویر مشخص است. اما در تصاویر ماهواره‌ای (نمای از بالا یا Nadir)، جهت شمال الزاماً بالا نیست. یک ساختمان اگر ۱۸۰ درجه بچرخد، باز هم ساختمان است.
  3. کمبود داده برچسب‌دار: رسم دقیق مرز (Polygon) هزاران ساختمان توسط انسان بسیار پرهزینه است. Augmentation به ما اجازه می‌دهد از همین تعداد کم، هزاران نمونه یادگیری بسازیم.

۲. تکنیک‌های رایج افزایش داده در علوم مکانی

ما می‌توانیم داده‌ها را به روش‌های هندسی یا رادیومتریک دستکاری کنیم:

الف) تغییرات هندسی (Geometric Transformations)

این تغییرات بر موقعیت و جهت پیکسل‌ها اثر می‌گذارند:

  • چرخش (Rotation): چرخاندن تصویر (۹۰، ۱۸۰، ۲۷۰ درجه). این کار در تصاویر هوایی بسیار ایمن و مفید است.
  • قرینه‌سازی (Flipping): آینه‌ای کردن تصویر (افقی یا عمودی).
  • برش و تغییر مقیاس (Cropping & Scaling): زوم کردن روی بخشی از تصویر برای اینکه مدل یاد بگیرد اشیاء را در مقیاس‌های مختلف (بزرگ و کوچک) تشخیص دهد.

ب) تغییرات رادیومتریک و طیفی (Radiometric & Spectral)

این تغییرات بر ارزش پیکسل‌ها (رنگ و نور) اثر می‌گذارند:

  • تزریق نویز (Noise Injection): اضافه کردن نویزهای تصادفی (مثل دانه‌های برفک) برای شبیه‌سازی سنسورهای بی کیفیت.
  • تغییر روشنایی و کنتراست: شبیه‌سازی شرایط مختلف تابش خورشید (صبح، ظهر، عصر).
  • حذف کانال (Channel Dropping): حذف تصادفی یکی از باندهای طیفی (مثلاً باند قرمز) تا مدل یاد بگیرد حتی در صورت خرابی بخشی از سنسور یا وجود مانع، باز هم کار کند.

۳. تکنیک‌های پیشرفته و خاص GeoAI

در سال‌های اخیر، روش‌های هوشمندتری برای افزایش داده‌های مکانی ابداع شده است:

۱. شبیه‌سازی ابرها و مه (Synthetic Haze & Clouds)

یکی از بزرگترین دشمنان سنجش از دور، ابرها هستند. ما می‌توانیم به صورت مصنوعی روی تصاویر تمیز، ابرهای دیجیتالی اضافه کنیم.

  • هدف: مدل یاد می‌گیرد که زیر ابرها چیزی وجود دارد یا اینکه باید آن نواحی را نادیده بگیرد، نه اینکه آن‌ها را به اشتباه «برف» یا «ساختمان سفید» تشخیص دهد.

۲. تکنیک‌های ترکیبی (Mixup & CutMix)

  • CutMix: بریدن یک تکه از یک تصویر (مثلاً یک هواپیما) و چسباندن آن روی یک تصویر دیگر (مثلاً وسط یک مزرعه!).
    • شاید غیرمنطقی به نظر برسد، اما این کار مدل را مجبور می‌کند تا روی بافت خود شیء تمرکز کند و نه فقط روی پس‌زمینه (Context). این تکنیک برای جلوگیری از بیش‌برازش (Overfitting) معجزه می‌کند.

۳. شبکه‌های مولد تخاصمی (GANs)

استفاده از هوش مصنوعی برای تولید هوش مصنوعی! مدل‌های GAN می‌توانند تصاویر ماهواره‌ای کاملاً مصنوعی اما واقعی تولید کنند. مثلاً می‌توان از آن‌ها خواست «تصویر این منطقه شهری را به حالت سیل‌زده تبدیل کن» تا مدل تشخیص سیل را با آن آموزش دهیم.

۴. خط قرمزها: چه زمانی نباید از Augmentation استفاده کرد؟

استفاده کورکورانه از این تکنیک در GeoAI می‌تواند خطرناک باشد:

  1. قرینه‌سازی عمودی در DEM: اگر روی «مدل رقومی ارتفاع» (DEM) کار می‌کنید، نباید ارزش پیکسل‌ها را معکوس کنید، زیرا کوه‌ها تبدیل به دره می‌شوند و فیزیک زمین به هم می‌ریزد.
  2. تغییر رنگ شدید در طبقه‌بندی پوشش گیاهی: اگر می‌خواهید سلامت گیاه را تشخیص دهید، تغییر فام رنگ (Hue) به صورت مصنوعی ممکن است گیاه سالم (سبز) را به گیاه بیمار (زرد) تبدیل کند، در حالی که برچسب (Label) آن هنوز «سالم» است. این کار مدل را گیج می‌کند.
  3. چرخش در تصاویر Street View: در تصاویر خیابانی (که توسط ماشین گوگل گرفته می‌شود)، آسمان همیشه بالاست. چرخاندن ۱۸۰ درجه تصویر در اینجا بی‌معنی است.

5. نتیجه‌گیری

داده‌ها سوخت موشک GeoAI هستند، اما Data Augmentation اکسیدکننده‌ای است که باعث می‌شود این سوخت با قدرت ده برابری بسوزد.

یک استراتژی مناسب افزایش داده می‌تواند دقت مدل را ۵ تا ۱۵ درصد افزایش دهد، بدون اینکه هزینه‌ای برای خرید داده‌های ماهواره‌ای جدید یا استخدام نیروی انسانی برای برچسب‌زنی پرداخت کنید. کلید موفقیت، درک فیزیک پدیده‌ها و اعمال تغییراتی است که در دنیای واقعی محتمل هستند.

نوشتن دیدگاه