افزایش داده (Data Augmentation) در GeoAI: کیمیاگری با پیکسلها
نویسنده: فاطمه جعفری نوبخت
در دنیای ایدهآل هوش مصنوعی، ما به بینهایت تصویر ماهوارهای برچسبخورده، با کیفیت بالا و در شرایط نوری مختلف دسترسی داریم. اما در دنیای واقعی، دادههای مکانی (Geospatial Data) گران، کمیاب و گاهی ناقص هستند.
افزایش داده (Data Augmentation) هنر و علمِ تولید دادههای آموزشی جدید از دادههای موجود است. این تکنیک مانند یک باشگاه بدنسازی برای مدلهای هوش مصنوعی عمل میکند؛ با ایجاد چالشهای مصنوعی (مثل چرخاندن تصویر یا تغییر رنگ)، مدل را برای روبرو شدن با دنیای واقعی و خشن آماده میکند.
۱. چرا در GeoAI به افزایش داده نیاز مبرم داریم؟
برخلاف تشخیص چهره یا متن، دادههای مکانی چالشهای محیطی منحصربهفردی دارند:
- تنوع فصلی و نوری: یک جنگل در تابستان سبز و در پاییز زرد است. مدلی که فقط تابستان را دیده باشد، در پاییز کور میشود.
- چرخشپذیری: در عکسهای معمولی (مثل عکس یک ماشین)، بالا و پایین تصویر مشخص است. اما در تصاویر ماهوارهای (نمای از بالا یا Nadir)، جهت شمال الزاماً بالا نیست. یک ساختمان اگر ۱۸۰ درجه بچرخد، باز هم ساختمان است.
- کمبود داده برچسبدار: رسم دقیق مرز (Polygon) هزاران ساختمان توسط انسان بسیار پرهزینه است. Augmentation به ما اجازه میدهد از همین تعداد کم، هزاران نمونه یادگیری بسازیم.
۲. تکنیکهای رایج افزایش داده در علوم مکانی
ما میتوانیم دادهها را به روشهای هندسی یا رادیومتریک دستکاری کنیم:
الف) تغییرات هندسی (Geometric Transformations)
این تغییرات بر موقعیت و جهت پیکسلها اثر میگذارند:
- چرخش (Rotation): چرخاندن تصویر (۹۰، ۱۸۰، ۲۷۰ درجه). این کار در تصاویر هوایی بسیار ایمن و مفید است.
- قرینهسازی (Flipping): آینهای کردن تصویر (افقی یا عمودی).
- برش و تغییر مقیاس (Cropping & Scaling): زوم کردن روی بخشی از تصویر برای اینکه مدل یاد بگیرد اشیاء را در مقیاسهای مختلف (بزرگ و کوچک) تشخیص دهد.
ب) تغییرات رادیومتریک و طیفی (Radiometric & Spectral)
این تغییرات بر ارزش پیکسلها (رنگ و نور) اثر میگذارند:
- تزریق نویز (Noise Injection): اضافه کردن نویزهای تصادفی (مثل دانههای برفک) برای شبیهسازی سنسورهای بی کیفیت.
- تغییر روشنایی و کنتراست: شبیهسازی شرایط مختلف تابش خورشید (صبح، ظهر، عصر).
- حذف کانال (Channel Dropping): حذف تصادفی یکی از باندهای طیفی (مثلاً باند قرمز) تا مدل یاد بگیرد حتی در صورت خرابی بخشی از سنسور یا وجود مانع، باز هم کار کند.
۳. تکنیکهای پیشرفته و خاص GeoAI
در سالهای اخیر، روشهای هوشمندتری برای افزایش دادههای مکانی ابداع شده است:
۱. شبیهسازی ابرها و مه (Synthetic Haze & Clouds)
یکی از بزرگترین دشمنان سنجش از دور، ابرها هستند. ما میتوانیم به صورت مصنوعی روی تصاویر تمیز، ابرهای دیجیتالی اضافه کنیم.
- هدف: مدل یاد میگیرد که زیر ابرها چیزی وجود دارد یا اینکه باید آن نواحی را نادیده بگیرد، نه اینکه آنها را به اشتباه «برف» یا «ساختمان سفید» تشخیص دهد.
۲. تکنیکهای ترکیبی (Mixup & CutMix)
- CutMix: بریدن یک تکه از یک تصویر (مثلاً یک هواپیما) و چسباندن آن روی یک تصویر دیگر (مثلاً وسط یک مزرعه!).
- شاید غیرمنطقی به نظر برسد، اما این کار مدل را مجبور میکند تا روی بافت خود شیء تمرکز کند و نه فقط روی پسزمینه (Context). این تکنیک برای جلوگیری از بیشبرازش (Overfitting) معجزه میکند.
۳. شبکههای مولد تخاصمی (GANs)
استفاده از هوش مصنوعی برای تولید هوش مصنوعی! مدلهای GAN میتوانند تصاویر ماهوارهای کاملاً مصنوعی اما واقعی تولید کنند. مثلاً میتوان از آنها خواست «تصویر این منطقه شهری را به حالت سیلزده تبدیل کن» تا مدل تشخیص سیل را با آن آموزش دهیم.
۴. خط قرمزها: چه زمانی نباید از Augmentation استفاده کرد؟
استفاده کورکورانه از این تکنیک در GeoAI میتواند خطرناک باشد:
- قرینهسازی عمودی در DEM: اگر روی «مدل رقومی ارتفاع» (DEM) کار میکنید، نباید ارزش پیکسلها را معکوس کنید، زیرا کوهها تبدیل به دره میشوند و فیزیک زمین به هم میریزد.
- تغییر رنگ شدید در طبقهبندی پوشش گیاهی: اگر میخواهید سلامت گیاه را تشخیص دهید، تغییر فام رنگ (Hue) به صورت مصنوعی ممکن است گیاه سالم (سبز) را به گیاه بیمار (زرد) تبدیل کند، در حالی که برچسب (Label) آن هنوز «سالم» است. این کار مدل را گیج میکند.
- چرخش در تصاویر Street View: در تصاویر خیابانی (که توسط ماشین گوگل گرفته میشود)، آسمان همیشه بالاست. چرخاندن ۱۸۰ درجه تصویر در اینجا بیمعنی است.
5. نتیجهگیری
دادهها سوخت موشک GeoAI هستند، اما Data Augmentation اکسیدکنندهای است که باعث میشود این سوخت با قدرت ده برابری بسوزد.
یک استراتژی مناسب افزایش داده میتواند دقت مدل را ۵ تا ۱۵ درصد افزایش دهد، بدون اینکه هزینهای برای خرید دادههای ماهوارهای جدید یا استخدام نیروی انسانی برای برچسبزنی پرداخت کنید. کلید موفقیت، درک فیزیک پدیدهها و اعمال تغییراتی است که در دنیای واقعی محتمل هستند.