گسترش روزافزون مدلهای زبانی بزرگ تحولی شگرف در تعامل انسان و ماشین ایجاد کرده است، اما این پیشرفت فناورانه هزینهی زیستمحیطی سنگینی به همراه دارد که معمولا با عنوان خطرات هوش مصنوعی از آن یاد میشود. در کنار سایر چالش های هوش مصنوعی اینبار میخواهیم به ردپای کربن در هوش مصنوعی بپردازیم. مصرف بیرویه انرژی در مراحل آموزش و پاسخدهی به پرسشها، این ابزارهای هوشمند را به یکی از منابع اصلی تولید کربن در حوزهی فناوری تبدیل کرده است. درک دقیق ابعاد این مسئله برای افرادی که به دنبال آموزش هوش مصنوعی هستند و متخصصان این حوزه ضروری است.
آلایندگیهای ناشی از هوش مصنوعی به دو بخش اصلی انتشارات نهفته و انتشارات عملیاتی تقسیم میشوند. انتشارات نهفته مربوط به فرآیند ساخت سختافزارهای پیچیده نظیر پردازندههای گرافیکی است، در حالی که انتشارات عملیاتی شامل برق مصرفی برای آموزش مدل و اجرای آن در مراکز داده میشود. در این مطلب از بخش آموزش هوش مصنوعی، به بررسی دقیق چرخهی حیات انرژی در مدلهای زبانی و روشهای نوین برای کاهش ردپای کربن در هوش مصنوعی میپردازیم.
دسته بندی کلی آلایندگی های هوش مصنوعی
آلایندگی های ناشی از توسعه و به کارگیری هوش مصنوعی (AI) به دو دسته اصلی انتشارات نهفته و انتشارات عملیاتی تقسیم می شوند. این تفکیک به متخصصان اجازه می دهد تا متوجه شوند ردپای کربن در هوش مصنوعی دقیقا در کدام مرحله از چرخه حیات یک مدل بیشتر است. در واقع آلودگی محیط زیستی فقط مربوط به زمان پردازش نیست و بخش بزرگی از آن پیش از شروع اولین خط کدنویسی اتفاق می افتد.
انتشارات نهفته در سخت افزار
آلایندگی نهفته شامل تمام گازهای گلخانه ای است که در طول فرآیند تولید تجهیزات فیزیکی ساطع می شوند. این مرحله با استخراج مواد اولیه برای ساخت تراشه ها شروع شده و تا مونتاژ سرورها، تجهیزات شبکه و سیستم های خنک کننده در دیتاسنترها ادامه می یابد. تولید قطعاتی مثل پردازنده های گرافیکی (GPU) به دلیل پیچیدگی بالا، انرژی بسیار زیادی مصرف می کند.
برخلاف تصور بسیاری از کاربران، آلایندگی نهفته بخش قابل توجهی از کل اثرات مخرب یک مدل هوش مصنوعی را به خود اختصاص می دهد. برآوردهای فنی نشان می دهد که حدود ۲۴ تا ۳۵ درصد از کل ردپای کربن در هوش مصنوعی، مربوط به همین بخش سخت افزاری است. حتی اگر دیتاسنترها از انرژی های تجدیدپذیر استفاده کنند، باز هم آلایندگی ناشی از تولید فیزیکی این قطعات به قوت خود باقی می ماند.
انتشارات عملیاتی در فرآیند اجرا
انتشارات عملیاتی به برقی اشاره دارد که برای آموزش مدل و پاسخگویی به درخواست های کاربران مصرف می شود. این بخش خود به دو دسته توان مصرفی پویا و توان مصرفی بیکار تقسیم می شود. توان پویا ناشی از فعالیت مستقیم پردازنده ها در زمان انجام محاسبات سنگین ریاضی است. در مقابل، توان بیکار به انرژی مورد نیاز برای نگهداری زیرساخت ها مثل سیستم های ذخیره سازی و تهویه مربوط می شود که حتی در زمان عدم پردازش هم مصرف می شوند.
در مدل های زبانی بزرگ، فرآیند آموزش اولیه انرژی وحشتناکی مصرف می کند اما نباید از مرحله استنتاج یا همان پاسخگویی به سوالات کاربران غافل شد. زمانی که تعداد کاربران یک مدل به میلیون ها نفر می رسد، مجموع انرژی مصرف شده برای پاسخ های کوتاه می تواند در مدت کوتاهی از انرژی مصرف شده در زمان آموزش پیشی بگیرد. نوع وظیفه ای که از هوش مصنوعی می خواهیم، مثلا تولید تصویر در مقابل تولید متن، تاثیر مستقیمی بر میزان مصرف انرژی و شدت آلایندگی عملیاتی دارد.
مقایسه شدت آلایندگی در مدل های مشهور
میزان مصرف انرژی و تولید آلایندهها در مدلهای بزرگ زبانی، همبستگی مستقیمی با تعداد پارامترها و بازدهی سختافزار دارد. بررسی عملکرد مدلهای شاخص نشان میدهد که منبع تأمین برق مراکز داده، عاملی تعیینکننده در میزان انتشار کربن است و صرفاً بزرگ بودن مدل به معنای آلایندگی بیشتر نیست.
| نوع مدل هوش مصنوعی | تخمین مصرف برق (کیلووات ساعت) | تولید کربن (معادل تن) | علت اصلی تفاوت |
|---|---|---|---|
| مدلهای متنباز بزرگ (آموزشدیده در مراکز هستهای) | ۴۳۳,۱۹۵ | ۲۵ | استفاده از شبکه برق با آلایندگی کم |
| مدلهای همهمنظوره بسیار بزرگ (تجاری) | ۱,۲۸۷,۰۰۰ | ۵۰۲ | حجم بسیار بالای پارامترها و شبکه برق فسیلی |
| مدلهای متمرکز بر پردازش زبان (مقیاس متوسط) | نامشخص | ۰.۶ | معماری بهینه برای وظایف خاص |
| مدلهای تولید تصویر | بسیار بالا (در هر فراخوانی) | بالاترین سطح در استنتاج | محاسبات سنگین پیکسلی |
دادههای فنی نشان میدهد که انتخاب موقعیت جغرافیایی مرکز داده برای آموزش، میتواند شدت آلایندگی را تا چندین برابر تغییر دهد. مدلهایی که در شبکههای برق متکی بر انرژی هستهای یا تجدیدپذیر آموزش میبینند، با وجود مصرف انرژی مشابه، ردپای کربنی بسیار کمتری نسبت به رقبای خود دارند. همچنین مدلهای اختصاصی که برای یک وظیفه مشخص طراحی شدهاند، در مرحله پاسخدهی به کاربر، انرژی بسیار کمتری نسبت به مدلهای همهکاره مصرف میکنند.
عوامل موثر بر مصرف انرژی در استنتاج
هزینه انرژی هر بار اجرای مدل هوش مصنوعی یا همان استنتاج، به ساختار داخلی و نوع خروجی درخواستی بستگی دارد. در حالی که مرحله آموزش یکبار انجام میشود، استنتاج میلیاردها بار تکرار شده و در میانمدت سهم اصلی مصرف برق دیتاسنترها را به خود اختصاص میدهد. بررسی دقیق این پارامترها نشان میدهد که انتخاب مدل و نحوه فراخوانی آن، تاثیر مستقیمی بر ردپای کربنی سیستم دارد.
- نوع وظیفه و پیچیدگی عملیات: تسکهای طبقهبندی متن یا تصویر نسبت به تسکهای مولد انرژی بسیار کمتری مصرف میکنند. تولید محتوای جدید به دلیل نیاز به پیشبینی مداوم توالیها، چرخههای پردازشی طولانیتری را به پردازنده گرافیکی تحمیل میکند.
- تعداد توکنهای خروجی: هر چقدر طول پاسخ تولید شده توسط مدل بلندتر باشد، مصرف برق افزایش مییابد. در مدلهای زبانی، تولید یک پاراگراف متن نسبت به یک جمله کوتاه، به معنای تکرار بیشتر فرآیند محاسباتی و در نتیجه مصرف توان الکتریکی بیشتر است.
- مدلهای چندمنظوره در برابر مدلهای تخصصی: مدلهای عمومی که برای انجام همزمان چندین کار طراحی شدهاند، در زمان پاسخگویی انرژی بیشتری نسبت به مدلهای تخصصی مصرف میکنند. مدلهای کوچکی که روی یک تسک خاص بهینهسازی شدهاند، با وجود تعداد پارامتر کمتر، بهرهوری انرژی بالاتری در زمان استنتاج دارند.
- معماری فنی مدل: چیدمان لایهها در مدلهای فقط رمزگشا نسبت به مدلهای توالیبهتوالی در میزان مصرف برق تفاوت ایجاد میکند. با افزایش طول خروجی، مدلهای توالیبهتوالی معمولا رفتار بهینهتری از خود نشان میدهند و از هدررفت انرژی در لایههای پنهان جلوگیری میکنند.
- بهینهسازیهای نرمافزاری: استفاده از تکنیکهایی مانند کوانتیزاسیون یا فشردهسازی مدل باعث میشود محاسبات با دقت پایینتر اما سرعت و بهرهوری بالاتر انجام شوند. این فرآیند باعث کاهش فشار بر حافظه گرافیکی و در نتیجه کاهش توان مصرفی در لحظه پاسخدهی میشود.
درک این عوامل به توسعهدهندگان کمک میکند تا میان دقت مدل و هزینههای زیستمحیطی آن توازن ایجاد کنند. انتخاب صحیح معماری و محدود کردن طول خروجیهای غیرضروری، سادهترین راه برای کاهش هزینههای عملیاتی در مقیاس بزرگ است.
تفاوت ردپای کربن در وظایف مختلف
هر درخواستی که برای هوش مصنوعی ارسال میشود، فشار یکسانی به زیرساختهای پردازشی وارد نمیکند. میزان مصرف انرژی در مرحله پاسخدهی یا استنتاج، به طور مستقیم با نوع عملیاتی که کاربر تقاضا کرده در ارتباط است. این تفاوت در مصرف برق، باعث میشود ردپای کربنی یک مدل هوشمند بسته به این که در حال نوشتن متن باشد یا خلق یک تصویر، به شدت تغییر کند.
تولید تصویر در برابر متن
تولید محتوای تصویری به دلیل ماهیت پیکسلمحور، سنگینترین وظیفه برای کارتهای گرافیک محسوب میشود. برای خلق یک تصویر، مدل باید محاسبات پیچیدهای را روی میلیونها نقطه انجام دهد که این فرآیند انرژی بسیار زیادی مصرف میکند. برآوردها نشان میدهد تولید یک تصویر تکی میتواند به اندازه شارژ کردن نیمی از باتری یک گوشی هوشمند، برق مصرف کرده و کربن تولید کند. در مقابل، مدلهای متنی به طور کلی ردپای کربنی بسیار کوچکتری دارند. البته در دنیای متن هم نوع وظیفه تعیینکننده است؛ برای مثال، وظایف مولد مانند خلاصهسازی یا نوشتن داستان، حدود ۱۰ برابر بیشتر از وظایف سادهای مثل دستهبندی متن یا تشخیص لحن انرژی میبرند. با این حال، حتی سنگینترین پردازشهای متنی در مقایسه با مدلهای تصویرساز، بسیار بهینهتر عمل میکنند.
مدل های عمومی در مقابل تخصصی
مدلهای چندمنظوره که برای پاسخ به هر نوع سوالی طراحی شدهاند، معمولا از نظر مصرف انرژی بازدهی پایینی دارند. این مدلها به دلیل تعداد پارامترهای بسیار زیاد، برای انجام یک کار ساده هم مجبور به درگیر کردن بخش بزرگی از شبکه عصبی خود هستند. این موضوع باعث میشود شدت انتشار کربن در مدلهای عمومی چندین برابر مدلهای تخصصی باشد که فقط برای یک وظیفه خاص تنظیم شدهاند.
استفاده از مدلهای تخصصی راهکاری موثر برای کاهش فشار بر دیتاسنترها است. زمانی که یک مدل فقط برای استخراج داده یا ترجمه آموزش میبیند، معماری آن به گونهای بهینه میشود که با کمترین توان محاسباتی، بیشترین دقت را ارائه دهد. مدلهای seq2seq و تخصصی در مقایسه با مدلهای عمومی بزرگ، مسیرهای محاسباتی کوتاهتری را طی میکنند و در نتیجه، گرمای کمتری تولید کرده و برق کمتری از شبکه میکشند.
استراتژی های مدیریتی و ابزارهای سنجش
سنجش میزان آلایندگی مدلهای زبانی از تخمینهای حدسی به سمت ابزارهای محاسباتی دقیق حرکت کرده است. این ابزارها به توسعهدهندگان اجازه میدهند قبل از شروع فرآیند سنگین آموزش، هزینههای زیستمحیطی را پیشبینی کرده و میان عملکرد فنی و پایداری شبکه برق تعادل ایجاد کنند.
- ابزار محاسباتی LLMCarbon: این چارچوب با دریافت ویژگیهای معماری مدل و تنظیمات سختافزاری، میزان کربن تولیدی را در دو بخش عملیاتی و نهفته تخمین میزند. این ابزار با تحلیل تعداد پارامترها و بازدهی سختافزار، بهینهترین حالت موازیسازی را پیشنهاد میدهد تا آلایندگی قبل از مصرف انرژی کنترل شود.
- سیستم رتبهبندی انرژی (AI Energy Star): این طرح مشابه برچسب انرژی در لوازم خانگی، معیاری ساده برای مقایسه مدلها در اختیار کاربران قرار میدهد. هدف این سیستم ایجاد شفافیت در بازار است تا کاربران بتوانند مدلهایی را انتخاب کنند که در عین کارایی بالا، مصرف انرژی کمتری در فاز استنتاج دارند.
- مدیریت پاسخگویی به تقاضا (Demand Response): مراکز داده با استفاده از این استراتژی، زمان آموزش مدلهای بزرگ را با ساعتهای اوج تولید انرژیهای تجدیدپذیر هماهنگ میکنند. در این روش، محاسبات سنگین در زمانهایی انجام میشود که شبکه برق دارای مازاد انرژی سبز است.
- انتقال بار محاسباتی (Load Shifting): این تکنیک شامل متوقف کردن موقت فرآیند آموزش و انتقال آن به مراکز دادهای است که در آن لحظه به منابع انرژی پایدارتر دسترسی دارند. این کار از طریق ذخیره نقاط بازگشت (Checkpoints) و جابهجایی میانسروری انجام میشود.
- استراتژی سختافزاری 3R: این رویکرد بر کاهش تولید قطعات (Reduce)، استفاده مجدد از اجزای سرور در خوشههای جدید (Reuse) و بازیافت دقیق تجهیزات (Recycle) تمرکز دارد استفاده از قطعات ماژولار باعث میشود به جای تعویض کامل سیستم، تنها قطعات آسیبدیده جایگزین شوند و عمر مفید سختافزار افزایش یابد.
- بهینهسازی هوشمند سرمایش: استفاده از مدلهای یادگیری ماشین برای کنترل دقیق سیستمهای تهویه و آزمایش روشهای نوین مانند استقرار سرورها در محیطهای آبی، کارایی مصرف انرژی در مراکز داده را به طور چشمگیری بهبود میبخشد.
اجرای این راهکارها نشان میدهد که کاهش ردپای کربن تنها به بهینهسازی کد محدود نمیشود، بلکه نیازمند مدیریت یکپارچه در سطح زنجیره تامین سختافزار و زیرساختهای توزیع انرژی است.
بهینه سازی سخت افزار و مراکز داده
مراکز داده برای کاهش ردپای کربنی خود به سمت استفاده هوشمند از منابع برق حرکت میکنند. این فرآیند فراتر از جایگزینی سوختهای فسیلی است و شامل هماهنگی دقیق زمان انجام محاسبات با میزان تولید انرژی سبز در شبکه میشود. بهینهسازی زیرساختها در کنار مدیریت زمانبندی پردازشها، کارایی عملیاتی این مراکز را در درازمدت تضمین میکند.
مدیریت انرژی و منابع تجدیدپذیر
سیستمهای مدیریت تقاضا اجازه میدهند تا پردازشهای سنگین آموزش مدل به ساعاتی منتقل شوند که انرژی تجدیدپذیر در شبکه فراوان و ارزان است. این استراتژی که انتقال بار محاسباتی نامیده میشود، فشار بر شبکههای برق را در ساعات اوج مصرف کاهش میدهد. استفاده از تکنیکهای نوین سرمایش مانند مراکز داده زیر آب یا سیستمهای سرمایش مایع، مصرف برق در بخش تهویه را به حداقل میرساند.
هوش مصنوعی خود در بهینهسازی مصرف انرژی دیتاسنترها نقش ایفا میکند. مدلهای تخصصی با پایش لحظهای دمای قطعات و ترافیک شبکه، بهترین تنظیمات را برای سیستمهای خنککننده اعمال میکنند. این رویکرد باعث میشود هدررفت انرژی در بخشهای غیرمحاسباتی به شکل چشمگیری کاهش یابد.
چرخه بازیافت و کاهش قطعات
طراحی سختافزارها بر پایه اصول کاهش، استفاده مجدد و بازیافت، از انباشت ضایعات الکترونیکی جلوگیری میکند. استفاده از ساختار چیپلتهای کوچک و متصل به جای پردازندههای یکپارچه، انعطافپذیری سیستم را در زمان ارتقا بالا میبرد. با این روش، به جای تعویض کامل بردهای گرانقیمت، تنها بخشهای مورد نیاز جایگزین میشوند.
ایجاد بازار ثانویه برای قطعات سختافزاری دیتاسنترها عمر مفید تجهیزات را افزایش میدهد. قطعاتی که برای پردازشهای سنگین هوش مصنوعی کارایی خود را از دست دادهاند، در بخشهای دیگر با نیازهای پردازشی کمتر مورد استفاده قرار میگیرند. این زنجیره باعث توزیع بهتر هزینههای زیستمحیطی تولید سختافزار در طول زمان میشود.
- ماژولار بودن: تعویض قطعات به صورت جداگانه برای جلوگیری از دور ریختن کل سیستم.
- سازگاری معکوس: توسعه مدلهایی که روی سختافزارهای قدیمی با کارایی مناسب اجرا شوند.
- شفافیت زنجیره تأمین: ثبت گزارشهای عملکرد سختافزار برای تسهیل فروش در بازارهای دست دوم.

