حداقل سیستم مورد نیاز هوش مصنوعی برای اجرا بهصورت لوکال به نوع و اندازه مدل هوش مصنوعی بستگی دارد. برای اجرای مدلهای زبان کوچک (مانند نسخههای اولیه LLaMA) ممکن است ۱۶ گیگابایت رم هم کافی باشد، اما برای ساخت تصویر با مدلهایی مانند Stable Diffusion، داشتن یک کارت گرافیک (GPU) با حافظه اختصاصی (VRAM) ضروری است.
در این مقاله، بهصورت دقیق و تستشده، نقش هر قطعه (CPU, RAM, GPU) را در اجرای هوش مصنوعی روی کامپیوتر شخصی بررسی میکنیم. سپس، دو کانفیگ سختافزاری را معرفی میکنیم: یک سیستم حداقلی برای شروع و آزمایش و یک کامپیوتر مناسب هوش مصنوعی برای کارهای تخصصیتر. هدف ما این است که به بهترین شکل، شما را بهمنظور انتخاب بهترین سختافزار موردنیاز راهنمایی کنیم.
| سطح کاربری | مدلهای نمونه | حداقل سیستم پیشنهادی |
|---|---|---|
| شروع و آزمایش | مدلهای زبان کوچک (تا 8 میلیارد پارامتر) مانند Llama3-8B، Whisper (پایه) | ۱۶ گیگابایت RAM CPU: مدرن (Core i5/Ryzen 5 نسل ۱۰ به بعد) GPU: اختیاری (حداقل ۴ گیگابایت VRAM) حافظه: ۵۰ گیگابایت SSD |
| کاربردی و حرفهای | مدلهای ساخت تصویر (Stable Diffusion)، مدلهای زبان متوسط (تا ۲۰ میلیارد پارامتر) | ۳۲ گیگابایت RAM CPU: قدرتمند (Core i7/Ryzen 7 نسل ۱۱ به بعد) GPU: الزامی (NVIDIA RTX با حداقل ۸ گیگابایت VRAM) حافظه: ۱۰۰ گیگابایت NVMe SSD |
فهرست مطالب
نقش قطعات کلیدی در اجرای هوش مصنوعی
برای انتخاب سیستم مناسب اجرای مدلهای هوش مصنوعی، ابتدا باید بدانیم هر قطعه سختافزاری چه وظیفهای برعهده دارد. مدلهای هوش مصنوعی، بهخصوص مدلهای زبان بزرگ (LLM)، نیازمندیهای پردازشی سنگینی دارند که بین قطعات مختلف تقسیم میشود. در ادامه نقش چهار جزء اصلی سیستم شما را بررسی میکنیم.

پردازنده مرکزی (CPU)
پردازنده یا CPU، مدیرکل عملیات در کامپیوتر شما است. وظیفه اصلی آن در فرایند اجرای هوش مصنوعی لوکال، مدیریت دادهها، اجرای دستورات سیستمعامل و آمادهسازی مدل برای پردازش است. اگرچه میتوان برخی مدلهای کوچک را فقط با CPU اجرا کرد، اما سرعت آن برای کارهای تخصصی بسیار پایین است. یک CPU مدرن با هستههای بیشتر، فرایندهای جانبی را بهتر مدیریت میکند و از ایجاد گلوگاه (Bottleneck) (لینک به Bottleneck چیست؟ – منتشر نشده) برای قطعات دیگر جلوگیری میکند.
حافظه رم (RAM)
حافظه RAM مانند میز کارتان است. قبلاز اینکه هر کاری روی مدل هوش مصنوعی انجام شود، باید تمام یا بخشی از آن از حافظه ذخیرهسازی (SSD) به داخل RAM بارگذاری شود.
- اندازه مدل: حجم مدل مستقیماً بر میزان رم موردنیاز تأثیر دارد. برای مثال، برای اجرای LLaMA لوکال (نسخه 8B)، به حدود ۱۶ گیگابایت رم نیاز دارید.
- فضای ناکافی: اگر رم کافی نباشد، سیستمعامل مجبور به استفاده از حافظه مجازی (Virtual Memory) روی SSD میشود که سرعت پردازش را بهشدت کاهش میدهد.
کارت گرافیک (GPU) و حافظه آن (VRAM)
کارت گرافیک یا GPU، مهمترین قطعه در سخت افزار مورد نیاز AI است. برخلاف CPU که برای انجام چند کار پیچیده بهصورت متوالی طراحی شده، GPU هزاران هسته کوچک دارد که میتوانند محاسبات ساده را بهصورت همزمان و موازی انجام دهند. این ویژگی دقیقاً همان چیزی است که مدلهای هوش مصنوعی برای پردازش سریع به آن نیاز دارند. اما نکته مهم، حافظه اختصاصی کارت گرافیک یا VRAM است.
- تفاوت VRAM و RAM: مدل هوش مصنوعی برای پردازش باسرعت بالا، باید مستقیماً در VRAM کارت گرافیک بارگذاری شود. VRAM حافظهای بسیار سریعتر از RAM سیستم است و مستقیماً به هستههای GPU متصل است.
- گلوگاه اصلی: اگر اندازه مدل از ظرفیت VRAM بیشتر باشد، سیستم مجبور میشود دادهها را مدام بین VRAM و RAM جابهجا کند. این فرایند بهشدت کند است و عملاً مزیت استفاده از GPU را از بین میبرد. به همین دلیل است که مثلاً برای سیستم مورد نیاز Stable Diffusion، داشتن حداقل ۸ گیگابایت VRAM یک ضرورت است.
فضای ذخیرهسازی (SSD)
مدلهای هوش مصنوعی فایلهای بسیار بزرگی هستند که حجم آنها از چند گیگابایت تا دهها گیگابایت متغیر است. سرعت خواندن و نوشتن حافظه ذخیرهسازی شما، مستقیماً بر زمان اولیه بارگذاری مدل تأثیر میگذارد.
- HDD درمقایسه با SSD: استفاده از هارد دیسکهای قدیمی (HDD) باعث میشود برای شروع به کار با یک مدل، دقایق طولانی منتظر بمانید.
- SSD NVMe: بهترین گزینه، استفاده از حافظههای SSD، بهخصوص از نوع NVMe است. این حافظهها سرعت بارگذاری مدل در RAM و VRAM را به چند ثانیه کاهش میدهند و تجربه کاری روانتری را برای اجرای AI بدون اینترنت فراهم میکنند.
سیستم مورد نیاز هوش مصنوعی برای شروع (مدلهای کوچک متنی)
| قطعه | حداقل مشخصات |
|---|---|
| پردازنده (CPU) | Intel Core i5 یا AMD Ryzen 5 (نسل ۱۰ به بعد) |
| حافظه رم (RAM) | ۱۶ گیگابایت DDR4 |
| کارت گرافیک (GPU) | اختیاری (پیشنهادی: ۴ گیگابایت VRAM) |
| فضای ذخیرهسازی | ۵۰ گیگابایت فضای خالی SSD |
اگر هدف شما ورود به دنیای هوش مصنوعی، آزمایش مدلهای زبان کوچک و یادگیری فرایند اجرای هوش مصنوعی روی کامپیوتر شخصی است، نیازی به سیستم بسیار گرانقیمت ندارید. کانفیگ حداقلی زیر به شما اجازه میدهد تا با ابزارهایی مانند Ollama یا LM Studio، مدلهای زبان کوچک (معمولاً با حجم زیر ۱۰ میلیارد پارامتر) را اجرا کرده و با آنها کار کنید.
این سیستم برای اجرای بسیاری از هوش مصنوعی های آفلاین که مبتنی بر متن هستند، کاملاً مناسب است و به شما امکان میدهد تا بدون وابستگی به اینترنت، به یک جایگزین ChatGPT روی سیستم خود دسترسی داشته باشید.
- حافظه رم (RAM): ۱۶ گیگابایت نقطه شروع است. این مقدار به شما اجازه میدهد مدلهایی مانند Llama 3 8B را بهراحتی در حافظه بارگذاری کنید.
- پردازنده (CPU): یک پردازنده مدرن برای مدیریت روان سیستمعامل و نرمافزارهای جانبی ضروری است تا تمام توان سیستم، صرف پردازش مدل شود.
- کارت گرافیک (GPU): اگرچه برای مدلهای متنی کوچک الزامی نیست و میتوان آنها را فقط با CPU اجرا کرد، اما حتی یک کارت گرافیک با ۴ گیگابایت VRAM نیز میتواند سرعت پاسخدهی (Inference) را بهشکل چشمگیری افزایش دهد.
سیستم پیشنهادی برای کارهای تخصصیتر (مدلهای متوسط و ساخت تصویر)
| قطعه | مشخصات پیشنهادی |
|---|---|
| پردازنده (CPU) | Intel Core i7 یا AMD Ryzen 7 (نسل ۱۱ به بعد) |
| حافظه رم (RAM) | ۳۲ گیگابایت DDR4/DDR5 |
| کارت گرافیک (GPU) | NVIDIA RTX 3060/4060 (با حداقل ۸ گیگابایت VRAM) |
| فضای ذخیرهسازی | ۱۰۰ گیگابایت فضای خالی NVMe SSD |
وقتی از مرحله آزمایش عبور کردید و بهدنبال استفاده جدی و حرفهای از هوش مصنوعی لوکال هستید، سخت افزار مورد نیاز AI نیز تغییر میکند. این کانفیگ برای کاربرانی طراحی شده که قصد تولید محتوای بصری با مدلهایی مانند Stable Diffusion یا اجرای مدلهای زبان متوسط (۱۰ تا ۳۰ میلیارد پارامتر) را دارند.
نکته: برای آشنایی با روند کار، مشاهده ویدیوی آموزشی نصب stable diffusion روی سیستم میتواند بسیار مفید باشد.
در این سطح، کارت گرافیک (GPU) از یک قطعه اختیاری به قطعه ضروری سیستم شما تبدیل میشود. تمام فشار پردازشی سنگین برای ساخت تصویر یا پاسخدهی سریع مدلهای زبان بزرگتر، بر دوش GPU و حافظه VRAM آن است.
- کارت گرافیک (GPU): حداقل ۸ گیگابایت VRAM برای اجرای Stable Diffusion آفلاین با رزولوشنهای استاندارد ضروری است. اما برای کار با رزولوشنهای بالاتر، مدلهای سفارشی سنگینتر و سرعت بالاتر، ۱۲ گیگابایت VRAM یا بیشتر بهشدت توصیه میشود. کارتهای سری NVIDIA RTX بهدلیل پشتیبانی گسترده از کتابخانههای CUDA بهترین گزینه هستند.
- حافظه رم (RAM): ۳۲ گیگابایت رم به شما این امکان را میدهد که همزمان با اجرای مدل، نرمافزارهای دیگری مانند مرورگر یا ویرایشگر تصویر را بدون کندی باز نگه دارید.
- فضای ذخیرهسازی (NVMe SSD): مدلهای تولید تصویر و Checkpointهای مختلف آنها میتوانند دهها گیگابایت فضا اشغال کنند. سرعت بالای NVMe SSD زمان بارگذاری این مدلهای سنگین را از چند دقیقه به چند ثانیه کاهش میدهد.
سیستم مورد نیاز هوش مصنوعی برای اجرای مدلهای محبوب ۲۰۲۶
| نام مدل هوش مصنوعی | پارامتر / نسخه | حداقل رم سیستم (RAM) | حداقل حافظه گرافیک (VRAM) | کاربرد و توضیحات |
|---|---|---|---|---|
| متا Llama 3 | 8B | 16 GB | 8 GB | پردازش متن، دستیار چت و دیالوگ (عملکرد سریع) |
| متا Llama 3 | 70B | 64 GB | +48 GB | استدلال پیچیده و کیفیت تجاری (نیازمند کلاستر GPU) |
| مایکروسافت Phi-3 Mini | 3.8B | 8 GB | 4 GB (یا حتی فقط با cpu) | مدل بسیار سبک، مناسب لپتاپ و Edge Devices |
| DeepSeek Coder | 7B | 16 GB | 8 GB | بهترین گزینه برای برنامهنویسی و تولید کد لوکال |
| Qwen 2 / Mistral NeMo | 7B−8B | 16 GB | 8 GB | پردازش ساختاریافته و کارهای سازمانی |
| گوگل Gemma 2 | 9B | 16 GB | 8 – 12 GB | مدل قدرتمند و بهینه جایگزین مدلهای بزرگتر |
| گوگل Gemma 2 | 27B | 32 GB | 24 GB | استدلال پیشرفته، نیازمند GPU پرچمدار (مثل RTX 4090) |
| OpenAI Whisper | Large (V3) | 16 GB | 8 GB | اجرای Whisper آفلاین برای تبدیل صوت به متن با بالاترین دقت |
وقتی بهدنبال یک سیستم برای اجرای AI لوکال هستید، باید بدانید که هر مدل هوش مصنوعی اشتهای سختافزاری متفاوتی دارد. امروزه نیاز به AI لوکال در ایران (برای حفظ حریم خصوصی دادهها و غلبه بر محدودیتهای شبکه) بهشدت احساس میشود. اگر قصد اجرای ChatGPT لوکال را دارید یا میخواهید از مدلهای آفلاین هوش مصنوعی استفاده کنید، در ادامه حداقل سیستم برای اجرای مدلهای AI مطرح در سال ۲۰۲۶ را بررسی کردهایم:
متا Llama 3 (نسخههای 8B و 70B):
برای اجرای LLaMA لوکال در نسخه ۸ میلیارد پارامتری (8B)، یک سیستم میانرده با ۱۶ گیگابایت رم مناسب است. این نسخه برای پردازش دیالوگها عالی است. اما اگر بخواهید نسخه قدرتمند 70B را اجرا کنید که کیفیت آن نزدیک به مدلهای تجاری است، به کلاسترهای گرافیکی بالا (با بیشاز ۴۸ گیگابایت VRAM) نیاز دارید. این مدلها محکی جدی برای سخت افزار مناسب اجرای مدلهای GPT لوکال محسوب میشوند.
مایکروسافت Phi-3 Mini:
این مدل بسیار فشرده است و با حداقل سختافزار (تنها ۸ گیگابایت رم) اجرا میشود. برای داشتن یک سیستم اجرای AI بدون اینترنت روی لپتاپهای معمولی یا حتی دستگاههای لبه (Edge Devices)، Phi-3 انتخاب بینظیری است.
مدل DeepSeek Coder 7B
برای اجرای دیپ سیک لوکال در حالت استاندارد به حدود ۱۶ گیگابایت رم نیاز دارید.
نکته حرفهای: با استفاده از نسخههای فشردهشده (Quantized 4-bit) میتوانید این مدل را بهراحتی روی کارتهای گرافیک معمولی (Consumer GPUs) اجرا کنید و AI بدون وابستگی به اینترنت برای کدنویسی داشته باشید.
مدلهای Qwen 2 و Mistral NeMo:
مدلهایی مانند Qwen 2 (7B) و Mistral NeMo (8B) که برای کارهای سازمانی و پردازش ساختاریافته عالی هستند، روی سیستمهای با ۱۶ گیگابایت رم به خوبی کار میکنند. بااینحال، نسخههای سنگینتری مانند Qwen 72B نیازمند سختافزارهای ردهبالا (High-end GPUs) هستند.
Gemma 2 (مدلهای گوگل):
این مدلها (نسخههای 9 B و 27 B) عملکردی در سطح مدلهای بزرگتر دارند. برای اجرای نسخه ۹ میلیارد پارامتری (9 B) بهعنوان سیستم مناسب اجرای LLM به صورت لوکال، به یک سیستم با حداقل 16 GB رم و یک کارت گرافیک با ۸ گیگابایت حافظه VRAM (مانند NVIDIA RTX 3060) نیاز دارید. اما نسخه 27B نیازمند سختافزار بسیار قدرتمندتری است و به کارت گرافیکهایی با حداقل VRAM 24 G (مثل RTX 3090 یا RTX 4090) نیاز دارد.
نیازهای سختافزاری فریمورکها و مخازن:
برای استفاده از این مدلها، معمولاً به ابزارهایی نیاز دارید که وابستگی شدیدی به بستر سختافزاری دارند.
- پلتفرمهای توسعه: اگر برنامهنویس هستید و قصد اجرای مدلهای PyTorch و TensorFlow لوکال را دارید، داشتن کارت گرافیک NVIDIA (برای پشتیبانی از CUDA) تقریباً الزامی است تا فرایندها تسریع شوند.
- دانلود و اجرای آفلاین: برای اجرای مدلهای Hugging Face آفلاین یا تبدیل صوت به متن ازطریق اجرای Whisper آفلاین، داشتن یک حافظه SSD سریع (NVMe) ضروری است تا بتوانید فایلهای حجیم را به سرعت فراخوانی کنید.
با درنظرگرفتن این موارد، متوجه میشویم که سیستم مورد نیاز اجرای هوش مصنوعی به صورت آفلاین کاملاً به ابعادی که برای کار خود متصور هستید (از مدلهای سبک چند گیگابایتی تا غولهای پردازشی) بستگی دارد.
ابزارهای نرمافزاری برای اجرای ساده هوش مصنوعی
برای تجربه روان مدلهای آفلاین هوش مصنوعی، علاوهبر داشتن سختافزار مناسب، استفاده از پلتفرمها و نرمافزارهای بهینه نیز ضروری است. خوشبختانه امروزه برای راهاندازی و اجرای مدلهای PyTorch و TensorFlow لوکال نیازی به درگیری با کدهای پیچیده برنامهنویسی و نصب دستی پیشنیازها ندارید. نرمافزارهای مدرن با سازگاری خودکار با پردازندههای گرافیکی (GPU) و مدیریت هوشمند منابع، اجرای هوش مصنوعی را به سادگی نصب یک برنامه معمولی کردهاند.
برای توسعهدهندگان و کاربرانی که به دنبال AI لوکال در ایران هستند، دو ابزار زیر از محبوبترین گزینهها برای دور زدن پیچیدگیهای فنی محسوب میشوند:
- Ollama: یک پلتفرم متنباز و بینظیر که بهترین گزینه برای اجرای سریع مدلهای متنی (LLM) روی مک، لینوکس و ویندوز است. اولاما با معماری بهینه خود، بهطور خودکار از توان GPU شما استفاده میکند و تجربهای مشابه اجرای ChatGPT لوکال را در محیط ترمینال برای شما فراهم میکند.
- LM Studio: اگر ترجیح میدهید در یک محیط گرافیکی (GUI) کار کنید، LM Studio گزینهای ایدهآل است. این ابزار به شما اجازه میدهد مدلهای مختلف را مستقیماً از Hugging Face جستجو، دانلود و روی سیستم خود اجرا کنید و بهصورت بصری میزان مصرف CPU و RAM را زیر نظر بگیرید.
آموزش ارتقای ظرفیت پردازش بدون تغییر سختافزار
باوجود پیشرفت ابزارهای نرمافزاری، اجرای مدلهای بسیار بزرگ مرزهای سختافزار خانگی را میشکند. بهعنوان مثال، اجرای مدلهای عظیمالجثه (مانند نسخه 120B از gpt-oss که به بیشاز 80 GB حافظه VRAM نیاز دارد)، آموزش (Fine-tuning) مدلهای اختصاصی یا نیاز به پردازش همزمان چندین درخواست سنگین، کامپیوترهای شخصی را با محدودیتهای جدی مواجه میکند.
در این شرایط، کمبود VRAM، سرعت پایین پردازش اطلاعات و زمان طولانی انتظار برای دریافت خروجی، با ایجاد گلوگاه در سیستم، عملاً انجام پروژههای حرفهای را غیرممکن میسازد.
لزوم استفاده از سرور هوش مصنوعی
برای عبور از این محدودیتها و جلوگیری از صرف هزینههای نجومی برای خرید قطعات، بهترین گزینه استفاده از سرور هوش مصنوعی است. این سرورها دسترسی فوری شما را به کارتهای گرافیک قدرتمند دیتاسنتری (مانند سریهای NVIDIA A100 یا H100)، حجم فوقالعاده بالای VRAM و زیرساختی کاملاً مقیاسپذیر فراهم میکنند. با این روش، میتوانید سنگینترین پروژههای هوش مصنوعی را بدون نگرانی از محدودیتهای سختافزاری سیستم شخصی خود با بالاترین سرعت اجرا کنید.
برای اطلاعات بیشتر در این مورد و درک نحوه عملکرد این زیرساخت، پیشنهاد میکنیم مقاله زیر را مطالعه کنید.
برخی ویژگیهای سرور هوش مصنوعی ابر فردوسی:
- دسترسی آنی به قدرتمندترین پردازندههای هوشمند (HPE, AMD EPYC, Intel Xeon)
- مجهز به رم DDR4 و هارد NVME
- مناسب یادگیری ماشین و مدلسازی، پردازش تصویری و واقعیت افزوده و…
- امکان خاموش کردن سرور و پرداخت فقط بهازای ساعات مصرف
- امکان اسنپشات لحظهای و ارتقا و تغییر آنی منابع
- و کلی امکانات جذاب دیگر با امکان تست نامحدود با ۱۰۰ هزارتومان اعتبار رایگان
جمعبندی
در این مقاله تلاش کردیم تا یک راهنمای کامل و واقعی برای انتخاب سیستم مورد نیاز هوش مصنوعی ارائه دهیم. دیدیم که اجرای AI لوکال از یک رویا به یک واقعیت در دسترس تبدیل شده است. از حداقل سختافزار برای اجرای مدلهای کوچک و متنی تا سیستمهای پیشنهادی برای ساخت تصویر با Stable Diffusion را بررسی کردیم و نشان دادیم که نیاز شما مستقیماً به نوع و اندازه مدل بستگی دارد. در نهایت نیز دیدیم که برای عبور از محدودیتهای سیستم خانگی، سرور هوش مصنوعی بهترین راهحل ممکن است.
آیا شما تجربهای در اجرای هوش مصنوعی روی کامپیوتر شخصی خود دارید؟ یا سؤالی در این زمینه برایتان باقی مانده است؟ در بخش نظرات با ما در میان بگذارید.
منابع:
adventuresincre | clarifai | pugetsystems | developers.openai | clarifai | openai | docs.ollama
سؤالات متداول
ضعیفترین سیستم مورد نیاز هوش مصنوعی آفلاین چیست؟
برای اجرای سبکترین مدلهای متنی (مانند Phi-3 Mini) به صورت آفلاین، یک سیستم با 8 GB رم و پردازنده (CPU) جدید کافی است. در این حالت سرعت پایین خواهد بود اما کار انجام میشود.
آیا میتوان هوش مصنوعی را بدون کارت گرافیک (GPU) اجرا کرد؟
بله، اما فقط برای مدلهای زبان کوچک (LLM). در این حالت، تمام پردازش روی CPU قرار میگیرد که باعث کندی شدید عملکرد میشود. برای ساخت تصویر (مانند Stable Diffusion) یا اجرای مدلهای بزرگ، داشتن GPU اختصاصی تقریباً ضروری است.
برای اجرای Stable Diffusion به چه مقدار VRAM نیاز است؟
حداقل مطلق 4 GB است، اما برای تجربه روان و تولید تصاویر با کیفیت مناسب، حداقل VRAM 8 GB توصیه میشود. برای رزولوشنهای بالاتر و سرعت بیشتر، VRAM 12 GB یا بیشتر ایدهآل است.
آیا ۱۶ گیگابایت رم برای هوش مصنوعی کافی است؟
بله، 16 GB رم سیستم، بهترین نقطه شروع برای بسیاری از مدلهای محبوب مانند Llama 3 8B است. این مقدار به شما اجازه میدهد تا اکثر مدلهای زبان متوسط و ابزارهای پایه ساخت تصویر را به راحتی اجرا کنید.
کامپیوترهای اپل (مک) با چیپ M-series برای هوش مصنوعی مناسب هستند؟
بله، بسیار مناسب هستند. به لطف معماری حافظه یکپارچه (Unified Memory)، چیپهای M1, M2 و M3 عملکرد فوقالعادهای در اجرای مدلهایی دارند که بهطور کامل در حافظه آنها جای میگیرند. این کامپیوترها گزینهای عالی برای توسعهدهندگان و کاربرانی هستند که میخواهند مدلها را بهصورت بهینه اجرا کنند.

