تعداد بلوک های بافت تعداد واحدهای سایه زن (یا پردازنده های جهانی)

مشترک شوید
به انجمن "page-electric.ru" بپیوندید!
VKontakte:

اتوماسیون حسابداری تراکنش های بانکی و اجرای آن در برنامه حسابداری 1C

اگر بتوان تمام فعالیت های یک شرکت را به فرآیندهای تجاری تقسیم کرد، آنگاه فرآیندها را می توان به اجزای کوچکتر تقسیم کرد. در روش شناسی ساخت فرآیندهای تجاری به این امر تجزیه می گویند...

قطعات داخلی و جانبی کامپیوتر

مطالعه مدل جمعیت گسسته با استفاده از برنامه Model Vision Studio

بلوک اصلی توصیف در MVS بلوک است. بلوک یک شیء فعال است که به صورت موازی و مستقل از سایر اشیاء در زمان پیوسته عمل می کند. بلوک یک بلوک جهت دار است...

استفاده از LMS Moodle در فرآیند آموزشی

هر دوره باید دارای یک منطقه مرکزی باشد. ممکن است ستون چپ یا راست با بلوک وجود نداشته باشد. اما بلوک های مختلف موجود در سیستم مدیریت یادگیری مودل باعث افزایش عملکرد...

بررسی قابلیت های معلمان در سیستم آموزش از راه دور مودل

برای افزودن منابع، عناصر، بلوک های جدید یا ویرایش منابع موجود در دوره خود، روی دکمه ویرایش واقع در بلوک کنترل کلیک کنید. نمای کلی پنجره دوره در حالت ویرایش در شکل 2.5 نشان داده شده است: شکل 2...

شبیه سازی در حین توسعه نرم افزار

واژگان UML شامل سه نوع بلوک ساختمانی است: موجودیت ها. رابطه؛ نمودارها موجودیت ها انتزاعیاتی هستند که عناصر اساسی یک مدل هستند...

شبیه سازی کار در کتابخانه

عملگرها - بلوک ها منطق مدل را تشکیل می دهند. GPSS/PC حدود 50 نوع بلوک مختلف دارد که هر کدام عملکرد خاصی را انجام می دهند. در پشت هر یک از این بلوک ها یک زیربرنامه مترجم مربوطه وجود دارد...

ویژگی های کلیدی CSS3

می توانید با استفاده از انواع بلوک های مکالمه که باز هم بر اساس فناوری های CSS3 ساخته شده اند، متن را به روشی اصلی طراحی کنید. (شکل 5.) شکل 5...

ویژگی های کلیدی CSS3

اثر شفافیت یک عنصر به وضوح در تصویر پس زمینه قابل مشاهده است و در موارد مختلف گسترده شده است سیستم عامل هاچون شیک و زیبا به نظر میرسه...

تهیه یک سند متنی مطابق با STP 01-01

واحدهای توسعه (کارت) یا کارت (کارت) که گاهی اوقات به آنها گفته می شود، می توانند برای سرویس دهی به دستگاه های متصل به رایانه شخصی IBM استفاده شوند. می توان از آنها برای اتصال دستگاه های اضافی (آداپتورهای صفحه نمایش، کنترل کننده دیسک و غیره) استفاده کرد...

خرابی و تعمیر کارت گرافیک

این بلوک ها در ارتباط با پردازشگرهای سایه زن از انواع مشخص شده کار می کنند، آنها داده های بافت لازم برای ساخت صحنه را انتخاب و فیلتر می کنند.

برنامه ثبت فرآیند تولید برای سیستم مدیریت خودکار سازمانی در صنعت الکترونیک

11 نوع بلوک وجود دارد که از آنها می توان یک سیستم MES خاص برای یک تولید خاص ساخت...

توسعه بسته نرم افزاری برای محاسبه خسارت تعمیرات اساسی

در پایین ترین سطح جزئیات، داده های پایگاه داده Oracle در بلوک های داده ذخیره می شود. یک بلوک داده مربوط به تعداد مشخصی بایت از فضای فیزیکی دیسک است...

توسعه سیستم مدیریت سخت افزار و نرم افزار برای پلتفرم های حمل و نقل در Simatic Step-7

واحدهای سیستم اجزای سیستم عامل هستند. آنها را می توان توسط برنامه ها (توابع سیستم، SFC) یا داده ها (بلوک های داده سیستم، SDB) ذخیره کرد. واحدهای سیستم دسترسی به عملکردهای مهم سیستم را فراهم می کنند...

دستگاه های موجود در رایانه

واحدهای توسعه (کارت) یا کارت (کارت) که گاهی اوقات به آنها گفته می شود، می توانند برای سرویس دهی به دستگاه های متصل به رایانه شخصی IBM استفاده شوند. می توان از آنها برای اتصال دستگاه های اضافی (آداپتورهای صفحه نمایش، کنترل کننده دیسک و غیره) استفاده کرد...

پردازنده‌های گرافیکی مدرن شامل بلوک‌های کاربردی زیادی هستند که تعداد و ویژگی‌های آن‌ها سرعت رندر نهایی را تعیین می‌کند که بر راحتی بازی تأثیر می‌گذارد. بر اساس تعداد مقایسه‌ای این بلوک‌ها در تراشه‌های ویدیویی مختلف، می‌توانید تقریباً سرعت یک GPU خاص را تخمین بزنید. تراشه‌های ویدیویی دارای ویژگی‌های بسیار زیادی هستند که در این بخش تنها مهمترین آنها را بررسی می‌کنیم.

سرعت ساعت تراشه ویدیویی

فرکانس کاری یک GPU معمولاً بر حسب مگاهرتز اندازه گیری می شود، یعنی میلیون ها سیکل در ثانیه. این مشخصه مستقیماً بر عملکرد تراشه ویدیویی تأثیر می گذارد - هرچه بالاتر باشد، GPU می تواند در واحد زمان کار بیشتری انجام دهد و تعداد رئوس و پیکسل های بیشتری را پردازش کند. مثالی از زندگی واقعی: فرکانس تراشه ویدئویی نصب شده بر روی برد Radeon HD 6670 840 مگاهرتز است و دقیقاً همان تراشه در مدل Radeon HD 6570 با فرکانس 650 مگاهرتز کار می کند. بر این اساس، تمام ویژگی های عملکرد اصلی متفاوت خواهد بود. اما این تنها فرکانس کاری تراشه نیست که عملکرد آن را تعیین می کند تا حد زیادی تحت تأثیر خود معماری گرافیکی قرار گیرد: طراحی و تعداد واحدهای اجرایی، ویژگی های آنها و غیره.

در برخی موارد، سرعت کلاک تک تک بلوک‌های GPU با سرعت بقیه تراشه‌ها متفاوت است. یعنی قسمت های مختلف پردازنده گرافیکی روی آن کار می کنند فرکانس های مختلف، و این برای افزایش راندمان انجام شد، زیرا برخی از واحدها قادر به کار در فرکانس های بالاتر هستند، در حالی که برخی دیگر اینگونه نیستند. اکثر کارت‌های گرافیک GeForce از NVIDIA به این پردازنده‌های گرافیکی مجهز هستند. یک مثال اخیر، تراشه ویدئویی در مدل GTX 580 است که اکثر آنها در فرکانس 772 مگاهرتز کار می کنند و واحدهای محاسباتی جهانی تراشه دارای فرکانس دو برابر شده - 1544 مگاهرتز هستند.

نرخ پر شدن

نرخ پر شدن نشان می دهد که تراشه ویدئویی با چه سرعتی قادر به ترسیم پیکسل است. دو نوع نرخ پر شدن وجود دارد: نرخ پر شدن پیکسل و نرخ پر شدن بافت. نرخ پر شدن پیکسل، سرعت ترسیم پیکسل ها روی صفحه را نشان می دهد و به فرکانس عملیاتی و تعداد واحدهای ROP (واحدهای عملیات شطرنجی و ترکیبی) بستگی دارد و نرخ پر شدن بافت، سرعت نمونه برداری از داده های بافت است که به فرکانس عملیاتی بستگی دارد. و تعداد واحدهای بافت

به عنوان مثال، حداکثر میزان پرکردن پیکسل GeForce GTX 560 Ti برابر با 822 (فرکانس تراشه) × 32 (تعداد واحدهای ROP) = 26304 مگاپیکسل در ثانیه، و نرخ پرکردن بافت 822 × 64 (تعداد واحدهای بافت سازی) = 5260 مگاپیکسل است. /s. به روشی ساده شده، وضعیت به این صورت است - هر چه عدد اول بزرگتر باشد، کارت گرافیک سریعتر می تواند پیکسل های تمام شده را بکشد، و هرچه عدد دوم بزرگتر باشد، داده های بافت سریعتر نمونه برداری می شود.

اگرچه اهمیت نرخ پر شدن خالص اخیراً به طور قابل توجهی کاهش یافته است و جای خود را به سرعت محاسباتی داده است، این پارامترها هنوز هم بسیار مهم هستند، به ویژه برای بازی هایی با هندسه ساده و محاسبات پیکسل و راس نسبتاً ساده. بنابراین هر دو پارامتر برای بازی های مدرن مهم هستند، اما باید متعادل باشند. بنابراین، تعداد واحدهای ROP در تراشه های ویدئویی مدرن معمولا کمتر از تعداد واحدهای بافت است.

تعداد واحدها یا پردازنده های محاسباتی (شیدر).

شاید در حال حاضر این بلوک ها قسمت های اصلی تراشه ویدیویی باشند. آنها برنامه های خاصی را اجرا می کنند که به عنوان سایه زن شناخته می شوند. علاوه بر این، اگر سایه‌زن‌های پیکسل قبلی بلوک‌های سایه‌زن پیکسل را انجام می‌دادند، و سایه‌زن‌های راس بلوک‌های راس را انجام می‌دادند، پس از آن برای مدتی معماری‌های گرافیکی متحد شدند و این واحدهای محاسباتی جهانی شروع به پرداختن به محاسبات مختلف کردند: محاسبات راس، پیکسل، هندسی و حتی جهانی.

برای اولین بار، معماری یکپارچه در تراشه ویدئویی کنسول بازی مایکروسافت Xbox 360 مورد استفاده قرار گرفت. و در تراشه های ویدئویی برای رایانه های شخصی، واحدهای سایه زن یکپارچه در برد NVIDIA GeForce 8800 ظاهر شد و از آن زمان، تمام تراشه های ویدئویی جدید بر اساس یک معماری یکپارچه هستند که دارای یک کد جهانی برای برنامه های سایه زن مختلف (راس، پیکسل، هندسی، و غیره)، و پردازنده های Unified مربوطه می توانند هر برنامه ای را اجرا کنند.

بر اساس تعداد واحدهای محاسباتی و فرکانس آنها، می توانید عملکرد ریاضی کارت های ویدئویی مختلف را مقایسه کنید. اکثر بازی ها در حال حاضر توسط عملکرد سایه زن های پیکسل محدود شده اند، بنابراین تعداد این بلوک ها بسیار مهم است. به عنوان مثال، اگر یک مدل کارت گرافیک مبتنی بر یک GPU با 384 پردازنده محاسباتی در ترکیب آن باشد، و دیگری از همان خط دارای یک GPU با 192 واحد محاسباتی باشد، در این صورت در فرکانس یکسان دومی دو برابر کندتر خواهد بود. نوع سایه زن، و به طور کلی خواهد بود همان تولید بیشتر.

اگرچه صرفاً بر اساس تعداد واحدهای محاسباتی نمی‌توان نتیجه‌گیری بدون ابهام در مورد عملکرد انجام داد، اما لازم است فرکانس ساعت و معماری متفاوت واحدهای نسل‌های مختلف و تولیدکنندگان تراشه را در نظر گرفت. فقط بر اساس این اعداد، می‌توانید تراشه‌ها را فقط در خط تولید یک سازنده مقایسه کنید: AMD یا NVIDIA. در موارد دیگر، باید به تست های عملکرد در بازی ها یا اپلیکیشن های مورد علاقه خود توجه کنید.

واحدهای بافت (TMU)

این واحدهای گرافیکی در ارتباط با پردازنده‌های محاسباتی کار می‌کنند. تعداد واحدهای بافت در یک تراشه ویدیویی عملکرد بافت را تعیین می کند - یعنی سرعت واکشی تکل ها از بافت ها.

اگرچه اخیراً تأکید بیشتری بر محاسبات ریاضی شده است و برخی از بافت‌ها با موارد رویه‌ای جایگزین می‌شوند، بار روی بلوک‌های TMU هنوز بسیار زیاد است، زیرا علاوه بر بافت‌های اصلی، باید از نقشه‌های معمولی و جابجایی نیز انتخاب شود. و همچنین بافرهای رندر هدف خارج از صفحه نمایش.

با در نظر گرفتن تاکید بسیاری از بازی ها از جمله عملکرد واحدهای تکسچرینگ، می توان گفت که تعداد واحدهای TMU و عملکرد بافت بالا مربوطه نیز یکی از مهم ترین پارامترهای تراشه های ویدئویی است. این پارامتر در هنگام استفاده از فیلتر ناهمسانگرد، که به نمونه‌های بافت اضافی نیاز دارد، و همچنین با الگوریتم‌های سایه نرم پیچیده و الگوریتم‌های جدید مانند Screen Space Ambient Occlusion، تأثیر خاصی بر سرعت رندر تصویر دارد.

واحدهای عملیات شطرنجی (ROP)

واحدهای شطرنجی عملیات نوشتن پیکسل های محاسبه شده توسط کارت گرافیک در بافرها و عملیات اختلاط آنها (ترکیب) را انجام می دهند. همانطور که در بالا اشاره کردیم، عملکرد بلوک‌های ROP بر نرخ پر شدن تأثیر می‌گذارد و این یکی از ویژگی‌های اصلی کارت‌های ویدیویی در همه زمان‌ها است. و اگرچه اخیراً اهمیت آن نیز تا حدودی کاهش یافته است، اما هنوز مواردی وجود دارد که عملکرد برنامه به سرعت و تعداد بلوک های ROP بستگی دارد. بیشتر اوقات این به دلیل استفاده فعال از فیلترهای پس از پردازش و فعال کردن آنتی آلیاسینگ در تنظیمات بالای بازی است.

اجازه دهید یک بار دیگر توجه کنیم که تراشه های ویدئویی مدرن را نمی توان تنها با تعداد بلوک های مختلف و فرکانس آنها ارزیابی کرد. هر سری GPU از معماری جدیدی استفاده می کند که در آن واحدهای اجرایی با واحدهای قدیمی تفاوت زیادی دارند و ممکن است نسبت تعداد واحدهای مختلف متفاوت باشد. بنابراین، بلوک‌های ROP AMD در برخی راه‌حل‌ها می‌توانند کار بیشتری را در هر چرخه ساعت نسبت به بلوک‌های راه‌حل‌های NVIDIA انجام دهند و بالعکس. همین امر در مورد قابلیت‌های واحدهای بافت TMU نیز صدق می‌کند - آنها در نسل‌های مختلف پردازنده‌های گرافیکی از تولیدکنندگان مختلف متفاوت هستند، و این باید هنگام مقایسه در نظر گرفته شود.

بلوک های هندسی

تا همین اواخر، تعداد واحدهای پردازش هندسه اهمیت خاصی نداشت. یک بلوک در GPU برای اکثر کارها کافی بود، زیرا هندسه در بازی ها بسیار ساده بود و تمرکز اصلی عملکرد محاسبات ریاضی بود. اهمیت پردازش هندسه موازی و تعداد بلوک های متناظر با ظهور پشتیبانی از هندسه تسلاسیون در DirectX 11 به طرز چشمگیری افزایش یافت. NVIDIA اولین کسی بود که پردازش داده های هندسی را موازی کرد، زمانی که چندین بلوک متناظر در تراشه های خانواده GF1xx ظاهر شد. سپس، AMD راه حل مشابهی را منتشر کرد (فقط در راه حل های برتر خط Radeon HD 6700 مبتنی بر تراشه های Cayman).

در این مطالب، ما به جزئیات نمی‌پردازیم. چیزی که در اینجا برای ما مهم است این است که تعداد واحدهای پردازش هندسه تأثیر زیادی بر عملکرد کلی در جدیدترین بازی‌هایی که از تسلیت استفاده می‌کنند، مانند Metro 2033، HAWX 2 و Crysis 2 (با آخرین وصله‌ها) دارد. و هنگام انتخاب یک کارت گرافیک بازی مدرن، توجه به عملکرد هندسی بسیار مهم است.

اندازه حافظه ویدیویی

حافظه خود توسط تراشه‌های ویدئویی برای ذخیره داده‌های لازم استفاده می‌شود: بافت‌ها، رئوس، داده‌های بافر و غیره. به نظر می‌رسد که هر چه بیشتر باشد، بهتر است. اما تخمین قدرت یک کارت گرافیک بر اساس میزان حافظه ویدئویی، رایج ترین اشتباه است! کاربران بی تجربه اغلب ارزش حافظه ویدئویی را بیش از حد ارزیابی می کنند و همچنان از آن برای مقایسه استفاده می کنند مدل های مختلفکارت های ویدئویی این قابل درک است - این پارامتر در لیست ویژگی ها نشان داده شده است سیستم های آمادهیکی از اولین ها، و روی جعبه های کارت گرافیک با فونت بزرگ نوشته شده است. بنابراین، به نظر یک خریدار بی تجربه به نظر می رسد که از آنجایی که حافظه دو برابر بیشتر است، پس سرعت چنین راه حلی باید دو برابر بیشتر باشد. واقعیت با این افسانه در این است که حافظه می تواند متفاوت باشد انواع مختلفو ویژگی ها و رشد بهره وری فقط تا یک حجم مشخص رشد می کند و پس از رسیدن به آن به سادگی متوقف می شود.

بنابراین، در هر بازی و با تنظیمات خاص و صحنه های بازی مقدار مشخصی حافظه ویدیویی وجود دارد که برای تمام داده ها کافی است. و حتی اگر 4 گیگابایت حافظه ویدیویی را در آنجا قرار دهید، دلیلی برای افزایش سرعت رندر وجود نخواهد داشت، سرعت توسط واحدهای اجرایی مورد بحث در بالا محدود می شود و به سادگی حافظه کافی وجود خواهد داشت. به همین دلیل است که در بسیاری از موارد یک کارت گرافیک با 1.5 گیگابایت حافظه ویدئویی با سرعت یک کارت با 3 گیگابایت کار می کند (همه موارد دیگر برابر هستند).

موقعیت‌هایی وجود دارد که حافظه بیشتر منجر به افزایش قابل مشاهده عملکرد می‌شود - این بازی‌ها بسیار سخت‌گیرانه هستند، به ویژه در وضوح‌های فوق‌العاده بالا و تنظیمات حداکثر کیفیت. اما چنین مواردی همیشه اتفاق نمی افتد و باید میزان حافظه را در نظر گرفت، فراموش نکنید که عملکرد به سادگی بالاتر از مقدار مشخصی افزایش نمی یابد. تراشه های حافظه پارامترهای مهم تری مانند عرض گذرگاه حافظه و فرکانس کاری آن نیز دارند. این موضوع به قدری گسترده است که در قسمت ششم مطالب خود به جزئیات بیشتری در مورد انتخاب میزان حافظه ویدیویی خواهیم پرداخت.

عرض گذرگاه حافظه

پهنای گذرگاه حافظه مهمترین مشخصه تأثیرگذار بر پهنای باند حافظه (MBB) است. عرض بزرگتر اجازه می دهد تا اطلاعات بیشتری را از حافظه ویدیویی به GPU و در واحد زمان انتقال دهیم که در اکثر موارد تأثیر مثبتی بر عملکرد دارد. از نظر تئوری، یک گذرگاه 256 بیتی می تواند دو برابر بیشتر از یک گذرگاه 128 بیتی در هر سیکل ساعت، داده انتقال دهد. در عمل تفاوت سرعت رندر اگرچه به دو برابر نمی رسد اما در بسیاری از موارد با تاکید بر پهنای باند حافظه ویدئویی بسیار به این نزدیک است.

کارت‌های ویدئویی بازی مدرن از عرض گذرگاه‌های مختلفی استفاده می‌کنند: از 64 تا 384 بیت (قبلا تراشه‌هایی با گذرگاه 512 بیتی وجود داشت)، بسته به محدوده قیمت و زمان انتشار یک مدل GPU خاص. برای ارزان‌ترین کارت‌های ویدئویی ارزان‌قیمت، 64 و کمتر 128 بیت، برای سطح متوسط ​​از 128 تا 256 بیت، و کارت‌های گرافیکی از محدوده قیمت بالا از اتوبوس‌هایی با عرض 256 تا 384 بیت استفاده می‌کنند. عرض گذرگاه دیگر نمی‌تواند صرفاً به دلیل محدودیت‌های فیزیکی رشد کند - اندازه قالب GPU برای قرار دادن بیش از یک گذرگاه 512 بیتی کافی نیست و این بسیار گران است. بنابراین، پهنای باند حافظه در حال حاضر با استفاده از انواع جدید حافظه افزایش یافته است (به زیر مراجعه کنید).

فرکانس حافظه ویدیویی

پارامتر دیگری که بر پهنای باند حافظه تأثیر می گذارد فرکانس ساعت آن است. و افزایش پهنای باند اغلب به طور مستقیم بر عملکرد کارت گرافیک در برنامه های سه بعدی تأثیر می گذارد. فرکانس گذرگاه حافظه در کارت های ویدئویی مدرن از 533 (1066، با احتساب دو برابر شدن) مگاهرتز تا 1375 (5500، با در نظر گرفتن چهار برابر شدن) مگاهرتز متغیر است، یعنی می تواند بیش از پنج برابر متفاوت باشد! و از آنجایی که پهنای باند حافظه هم به فرکانس حافظه و هم به عرض گذرگاه آن بستگی دارد، حافظه با یک گذرگاه 256 بیتی که در فرکانس 800 (3200) مگاهرتز کار می کند، در مقایسه با حافظه ای که در 1000 (4000) مگاهرتز کار می کند، پهنای باند بیشتری خواهد داشت. گذرگاه 128 بیتی.

توجه ویژه به پارامترهای عرض گذرگاه حافظه، نوع و فرکانس کاری آن باید هنگام خرید کارت‌های گرافیکی نسبتاً ارزان، که بسیاری از آنها فقط دارای رابط‌های 128 بیتی یا حتی 64 بیتی هستند، مورد توجه قرار گیرد که تأثیر بسیار منفی بر عملکرد آنها دارد. . به طور کلی، خرید یک کارت گرافیک با استفاده از گذرگاه حافظه ویدیویی 64 بیتی برای رایانه های شخصی بازی را توصیه نمی کنیم. توصیه می شود حداقل یک سطح متوسط ​​با حداقل گذرگاه 128 یا 192 بیتی را ترجیح دهید.

انواع حافظه

کارت گرافیک های مدرن به انواع مختلف حافظه مجهز هستند. دیگر حافظه SDR تک نرخی قدیمی را در هیچ کجا نخواهید دید، اما انواع مدرنحافظه های DDR و GDDR دارای ویژگی های متفاوتی هستند. انواع مختلف DDR و GDDR به شما این امکان را می‌دهند که دو یا چهار برابر داده‌های بیشتری را در یک فرکانس ساعت در واحد زمان انتقال دهید، و بنابراین، رقم فرکانس کاری اغلب دو یا چهار برابر می‌شود، ضربدر 2 یا 4 می‌شود. بنابراین، اگر فرکانس 1400 مگاهرتز مشخص شود. برای حافظه DDR ، این حافظه در فرکانس فیزیکی 700 مگاهرتز کار می کند ، اما آنها فرکانس به اصطلاح "موثر" را نشان می دهند ، یعنی فرکانسی که حافظه SDR باید در آن کار کند تا پهنای باند یکسانی را ارائه دهد. همان چیزی که در مورد GDDR5 وجود دارد، اما فرکانس آن حتی چهار برابر شده است.

مزیت اصلی انواع جدید حافظه، قابلیت کارکرد با سرعت کلاک بالاتر و در نتیجه افزایش پهنای باند نسبت به فناوری های قبلی است. این به قیمت تاخیرهای افزایش یافته به دست می آید، اما برای کارت های ویدئویی چندان مهم نیستند. اولین بردی که از حافظه DDR2 استفاده کرد NVIDIA GeForce FX 5800 Ultra بود. از آن زمان، فناوری حافظه های گرافیکی پیشرفت چشمگیری داشته است و استاندارد GDDR3 که نزدیک به مشخصات DDR2 است، با تغییراتی به طور خاص برای کارت های ویدئویی توسعه یافته است.

GDDR3 حافظه ای است که به طور خاص برای کارت های ویدئویی طراحی شده است، با فناوری های مشابه DDR2، اما با بهبود مصرف و ویژگی های اتلاف گرما، که امکان ایجاد تراشه هایی با سرعت کلاک بالاتر را فراهم می کند. با وجود این واقعیت که این استاندارد توسط ATI توسعه داده شد، اولین کارت گرافیکی که از آن استفاده کرد، دومین اصلاح NVIDIA GeForce FX 5700 Ultra و مورد بعدی GeForce 6800 Ultra بود.

GDDR4 توسعه بیشتر حافظه گرافیکی است که تقریباً دو برابر سریعتر از GDDR3 کار می کند. تفاوت اصلی بین GDDR4 و GDDR3 که برای کاربران قابل توجه است، بار دیگر افزایش فرکانس کاری و کاهش مصرف انرژی است. از نظر فنی، حافظه GDDR4 تفاوت چندانی با GDDR3 ندارد. اولین کارت‌های گرافیکی با تراشه‌های GDDR4 ATI Radeon X1950 XTX بودند و انویدیا اصلاً محصولات مبتنی بر این نوع حافظه را عرضه نکرد. مزایای تراشه های حافظه جدید نسبت به GDDR3 این است که مصرف انرژی ماژول ها می تواند حدود یک سوم کمتر باشد. این از طریق رتبه بندی ولتاژ پایین تر برای GDDR4 به دست می آید.

با این حال، GDDR4 به طور گسترده حتی در راه حل های AMD استفاده نمی شود. با شروع با خانواده پردازنده‌های گرافیکی RV7x0، کنترل‌کننده‌های حافظه کارت گرافیک از نوع جدیدی از حافظه GDDR5 پشتیبانی می‌کنند که با فرکانس چهارگانه مؤثر تا 5.5 گیگاهرتز و بالاتر (از لحاظ نظری، فرکانس‌های تا 7 گیگاهرتز امکان‌پذیر است) کار می‌کند، که توان عملیاتی را افزایش می‌دهد. تا 176 گیگابایت بر ثانیه با استفاده از رابط 256 بیتی. اگر برای افزایش پهنای باند حافظه حافظه GDDR3/GDDR4 استفاده از یک گذرگاه 512 بیتی ضروری بود، در این صورت انتقال به استفاده از GDDR5 امکان دو برابر شدن کارایی را با اندازه کریستال های کوچکتر و مصرف انرژی کمتر فراهم کرد.

مدرن ترین انواع حافظه های ویدئویی GDDR3 و GDDR5 هستند که در برخی جزئیات با DDR تفاوت دارند و همچنین با انتقال داده های دوگانه یا چهارگانه کار می کنند. این نوع حافظه ها از فناوری های خاصی برای افزایش فرکانس کاری استفاده می کنند. بنابراین، حافظه GDDR2 معمولاً در فرکانس‌های بالاتر در مقایسه با DDR، GDDR3 در فرکانس‌های بالاتر عمل می‌کند و GDDR5 حداکثر فرکانس و پهنای باند را در حال حاضر فراهم می‌کند. اما مدل‌های ارزان قیمت هنوز به حافظه DDR3 "غیر گرافیکی" با فرکانس بسیار پایین‌تر مجهز هستند، بنابراین باید با دقت بیشتری کارت گرافیک را انتخاب کنید.

معماری GPU: ویژگی ها

واقعی بودن گرافیک سه بعدی تا حد زیادی به عملکرد کارت گرافیک بستگی دارد. هرچه تعداد بلوک‌های سایه‌زن پیکسلی پردازنده بیشتر باشد و فرکانس آن بیشتر باشد، می‌توان جلوه‌های بیشتری را روی صحنه سه‌بعدی اعمال کرد تا درک بصری آن را بهبود بخشد.

GPU شامل بسیاری از بلوک های عملکردی مختلف است. با تعداد برخی از اجزا، می توانید تخمین بزنید که GPU چقدر قدرتمند است. قبل از حرکت بیشتر، اجازه دهید مهم ترین بلوک های کاربردی را مرور کنیم.

پردازنده های راس (واحد سایه زن راس)

مانند واحدهای سایه زن پیکسل، پردازنده های راس کد سایه زن را اجرا می کنند که رئوس را لمس می کند. از آنجایی که بودجه راس بزرگتر امکان ایجاد اشیاء سه بعدی پیچیده تر را فراهم می کند، عملکرد پردازنده های راس در صحنه های سه بعدی با تعداد اشیاء پیچیده یا زیاد بسیار مهم است. با این حال، واحدهای سایه زن راس هنوز هم مانند پردازنده‌های پیکسل تأثیر آشکاری بر عملکرد ندارند.

پردازنده های پیکسل (واحد سایه زن پیکسل)

پردازنده پیکسلی جزء یک تراشه گرافیکی است که به پردازش برنامه های سایه زن پیکسل اختصاص داده شده است. این پردازنده ها محاسباتی را انجام می دهند که فقط به پیکسل ها مربوط می شود. از آنجایی که پیکسل ها حاوی اطلاعات رنگی هستند، سایه زن های پیکسل به شما اجازه می دهد تا جلوه های گرافیکی چشمگیری داشته باشید. به عنوان مثال، بیشتر افکت های آبی که در بازی ها می بینید با استفاده از سایه زن های پیکسل ایجاد می شوند. به طور معمول، تعداد پردازنده های پیکسل برای مقایسه عملکرد پیکسل کارت های ویدئویی استفاده می شود. اگر یک کارت دارای هشت واحد سایه زن پیکسل و دیگری دارای 16 واحد باشد، منطقی است که فرض کنیم یک کارت گرافیک با 16 واحد در پردازش برنامه های سایه زن پیچیده پیکسل سریعتر خواهد بود. سرعت کلاک را نیز باید در نظر گرفت، اما امروزه دوبرابر کردن تعداد پردازنده‌های پیکسلی نسبت به دو برابر کردن فرکانس تراشه‌های گرافیکی، صرفه‌جویی در مصرف انرژی دارد.

شیدرهای یکپارچه

شیدرهای یکپارچه هنوز وارد دنیای رایانه های شخصی نشده اند، اما استاندارد آتی DirectX 10 مبتنی بر معماری مشابهی است. یعنی ساختار کد برنامه های رأس، هندسه و پیکسل یکسان خواهد بود، اگرچه سایه بان ها کار متفاوتی را انجام می دهند. مشخصات جدید را می توان در Xbox 360 مشاهده کرد، جایی که GPU به طور ویژه توسط ATi برای مایکروسافت طراحی شده است. دیدن اینکه DirectX 10 جدید چه پتانسیل هایی را به همراه دارد بسیار جالب خواهد بود.

واحدهای نقشه برداری بافت (TMU)

بافت ها باید انتخاب و فیلتر شوند. این کار توسط واحدهای نگاشت بافت انجام می شود که در ارتباط با واحدهای سایه زن پیکسل و رأس کار می کنند. وظیفه TMU اعمال عملیات بافت بر روی پیکسل ها است. تعداد واحدهای بافت در یک GPU اغلب برای مقایسه عملکرد بافت کارت‌های ویدئویی استفاده می‌شود. منطقی است که فرض کنیم یک کارت گرافیک با TMU های بیشتر، عملکرد بافت بهتری را ارائه می دهد.

واحدهای اپراتور رستر (ROP)

پردازنده های رستر وظیفه نوشتن داده های پیکسلی در حافظه را بر عهده دارند. سرعتی که این عملیات با آن انجام می شود، نرخ پر شدن است. در روزهای اولیه شتاب دهنده های سه بعدی، ROP و نرخ پر شدن بسیار بود ویژگی های مهمکارت های ویدئویی امروزه، کار ROP هنوز مهم است، اما عملکرد کارت گرافیک دیگر مانند گذشته توسط این بلوک ها محدود نمی شود. بنابراین، عملکرد (و تعداد) ROP به ندرت برای ارزیابی سرعت یک کارت گرافیک استفاده می شود.

نوار نقاله

خطوط لوله برای توصیف معماری کارت های ویدئویی و ارائه یک ایده بسیار واضح از عملکرد GPU استفاده می شود.

نوار نقاله را نمی توان یک اصطلاح فنی دقیق در نظر گرفت. GPU از خطوط لوله مختلفی استفاده می کند که عملکردهای مختلفی را انجام می دهند. از لحاظ تاریخی، خط لوله به معنای یک پردازنده پیکسلی بود که به واحد نقشه برداری بافت (TMU) متصل بود. به عنوان مثال، کارت گرافیک Radeon 9700 از هشت پردازنده پیکسل استفاده می کند که هر کدام به TMU خود متصل هستند، بنابراین کارت دارای هشت خط لوله در نظر گرفته می شود.

اما توصیف پردازنده های مدرن با تعداد خطوط لوله بسیار دشوار است. در مقایسه با طراحی های قبلی، پردازنده های جدید از ساختار ماژولار و تکه تکه استفاده می کنند. ATi را می توان یک مبتکر در این زمینه در نظر گرفت که با خط کارت گرافیک X1000 به ساختار ماژولار تبدیل شد که امکان دستیابی به دستاوردهای عملکرد را از طریق بهینه سازی داخلی ممکن کرد. برخی از بلوک‌های CPU بیشتر از سایرین استفاده می‌شوند و برای بهبود عملکرد GPU، ATi سعی کرده است بین تعداد بلوک‌های مورد نیاز و ناحیه Die (که نمی‌توان آن را زیاد افزایش داد) سازش پیدا کند. در این معماری، اصطلاح "pixel pipeline" معنای خود را از دست داده است، زیرا پردازنده های پیکسل دیگر به TMU های خود متصل نیستند. به عنوان مثال، پردازنده گرافیکی ATi Radeon X1600 دارای 12 واحد سایه زن و تنها چهار واحد نقشه برداری بافت TMU است. بنابراین، نمی توان گفت که معماری این پردازنده دارای 12 پیکسل پیکسل است، همانطور که نمی توان گفت که تنها چهار مورد از آنها وجود دارد. با این حال، طبق سنت، خطوط لوله پیکسل هنوز ذکر شده است.

با در نظر گرفتن مفروضات فوق، تعداد خطوط لوله پیکسل در یک GPU اغلب برای مقایسه کارت های ویدئویی (به استثنای خط ATi X1x00) استفاده می شود. به عنوان مثال، اگر کارت‌های ویدئویی را با خط لوله 24 و 16 می‌گیرید، کاملاً منطقی است که فرض کنیم کارت با 24 خط لوله سریع‌تر خواهد بود.


محتوا

نرخ پر شدن نشان می دهد که تراشه ویدئویی با چه سرعتی قادر به ترسیم پیکسل است. دو نوع نرخ پر شدن وجود دارد: نرخ پر شدن پیکسل و نرخ پر شدن بافت. نرخ پر شدن پیکسل، سرعت ترسیم پیکسل ها روی صفحه را نشان می دهد و به فرکانس عملیاتی و تعداد واحدهای ROP (واحدهای عملیات شطرنجی و ترکیبی) بستگی دارد و نرخ پر شدن بافت، سرعت نمونه برداری از داده های بافت است که به فرکانس عملیاتی بستگی دارد. و تعداد واحدهای بافت

برای مثال، نرخ پرکردن پیکسل GeForce GTX 275 633 (فرکانس تراشه) * 28 (تعداد واحدهای ROP) = 17724 مگاپیکسل در ثانیه، و نرخ پرکردن بافت 633 * 80 (تعداد واحدهای بافت) = 50640 مگاپیکسل در ثانیه است. . هرچه عدد اول بزرگتر باشد، کارت گرافیک سریع‌تر می‌تواند پیکسل‌های تمام‌شده را بکشد، و هرچه عدد دوم بزرگ‌تر باشد، داده‌های بافت سریع‌تر نمونه‌برداری می‌شوند. هر دو پارامتر برای بازی های مدرن مهم هستند، اما باید متعادل باشند. به همین دلیل است که تعداد واحدهای ROP در تراشه های مدرن معمولا کمتر از تعداد واحدهای بافت است.

تعداد بلوک های سایه زن (پیکسل، راس).

سایه زن رئوس وظیفه ساخت رئوس یک شی را بر عهده دارد. آنها قابلیت های کارت های مدرن را برای پردازش اشیاء اولیه گرافیکی و به طور کلی عملکرد خود کارت تعیین می کنند. سایه‌زن پیکسلی نسبت به سایه‌زن رأس مرتبط‌تر است، بنابراین تعداد آنها معمولاً بیشتر است. تقسیم بندی به پیکسل و راس اخیراً (با انتشار Direct 10) ارتباط خود را از دست داده است. همه آنها بسته به موقعیت خاص با بلوک های سایه زن یکپارچه جایگزین می شوند. آنها از سایه‌زن‌های پیکسلی و رأس و همچنین از سایه‌زن‌های هندسی استفاده می‌کنند که در Direct 10 ظاهر شد.

تعداد واحدهای بافت سازی TMU

تعداد واحدهای بافت TMU که عملکرد بافت یا سرعت نمونه برداری و نقشه برداری بافت ها را تعیین می کند. این به ویژه برای فیلتر ناهمسانگرد مرتبط است. بالاترین ارزشبلوک های TMU در بازی های قدیمی تر وجود دارند. اکنون آنها عملاً ارتباط خود را از دست داده اند، زیرا ... پهنای باند گذرگاه حافظه در سیستم‌های مدرن برای عملکرد عادی کارت‌های با کارایی بالا کافی نیست. اکثر آنها مجهز به حافظه مخصوص به خود هستند که برای ذخیره داده های لازم، یعنی بافت ها، رئوس و غیره لازم است.

واحدهای عملیات شطرنجی (ROP)

واحدهای شطرنجی عملیات نوشتن پیکسل های محاسبه شده توسط کارت گرافیک در بافرها و عملیات اختلاط آنها (ترکیب) را انجام می دهند. همانطور که در بالا اشاره کردیم، عملکرد بلوک‌های ROP بر نرخ پر شدن تأثیر می‌گذارد و این یکی از ویژگی‌های اصلی کارت‌های ویدیویی در همه زمان‌ها است. و اگرچه اخیراً اهمیت آن نیز تا حدودی کاهش یافته است، اما هنوز مواردی وجود دارد که عملکرد برنامه به سرعت و تعداد بلوک های ROP بستگی دارد. بیشتر اوقات این به دلیل استفاده فعال از فیلترهای پس از پردازش و فعال کردن آنتی آلیاسینگ در تنظیمات بالای بازی است.

اجازه دهید یک بار دیگر توجه کنیم که تراشه های ویدئویی مدرن را نمی توان تنها با تعداد بلوک های مختلف و فرکانس آنها ارزیابی کرد. هر سری GPU از معماری جدیدی استفاده می کند که در آن واحدهای اجرایی با واحدهای قدیمی تفاوت زیادی دارند و ممکن است نسبت تعداد واحدهای مختلف متفاوت باشد. بنابراین، بلوک‌های ROP AMD در برخی راه‌حل‌ها می‌توانند کار بیشتری را در هر چرخه ساعت نسبت به بلوک‌های راه‌حل‌های NVIDIA انجام دهند و بالعکس. همین امر در مورد قابلیت‌های واحدهای بافت TMU نیز صدق می‌کند - آنها در نسل‌های مختلف پردازنده‌های گرافیکی از تولیدکنندگان مختلف متفاوت هستند، و این باید هنگام مقایسه در نظر گرفته شود.

بلوک های هندسی

تا همین اواخر، تعداد واحدهای پردازش هندسه اهمیت خاصی نداشت. یک بلوک در GPU برای اکثر کارها کافی بود، زیرا هندسه در بازی ها بسیار ساده بود و تمرکز اصلی عملکرد محاسبات ریاضی بود. اهمیت پردازش هندسه موازی و تعداد بلوک های متناظر با ظهور پشتیبانی از هندسه تسلاسیون در DirectX 11 به طرز چشمگیری افزایش یافت. NVIDIA اولین کسی بود که پردازش داده های هندسی را موازی کرد، زمانی که چندین بلوک متناظر در تراشه های خانواده GF1xx ظاهر شد. سپس، AMD راه حل مشابهی را منتشر کرد (فقط در راه حل های برتر خط Radeon HD 6700 مبتنی بر تراشه های Cayman).

اندازه حافظه ویدیویی

حافظه خود توسط تراشه‌های ویدئویی برای ذخیره داده‌های لازم استفاده می‌شود: بافت‌ها، رئوس، داده‌های بافر و غیره. به نظر می‌رسد که هر چه بیشتر باشد، بهتر است. اما تخمین قدرت یک کارت گرافیک بر اساس میزان حافظه ویدئویی، رایج ترین اشتباه است! کاربران بی تجربه اغلب ارزش حافظه ویدئویی را بیش از حد تخمین می زنند و همچنان از آن برای مقایسه مدل های مختلف کارت های ویدئویی استفاده می کنند. این قابل درک است - این پارامتر یکی از اولین پارامترهایی است که در لیست ویژگی های سیستم های تمام شده نشان داده شده است و با فونت بزرگ روی جعبه های کارت گرافیک نوشته شده است. بنابراین، به نظر یک خریدار بی تجربه به نظر می رسد که از آنجایی که حافظه دو برابر بیشتر است، پس سرعت چنین راه حلی باید دو برابر بیشتر باشد. تفاوت واقعیت با این افسانه این است که حافظه انواع و ویژگی های متفاوتی دارد و رشد بهره وری تنها تا یک حجم مشخص رشد می کند و پس از رسیدن به آن به سادگی متوقف می شود.

تراشه های حافظه پارامترهای مهم تری مانند عرض گذرگاه حافظه و فرکانس کاری آن نیز دارند.

عرض گذرگاه حافظه

پهنای گذرگاه حافظه مهمترین مشخصه تأثیرگذار بر پهنای باند حافظه (MBB) است. عرض بزرگتر اجازه می دهد تا اطلاعات بیشتری را از حافظه ویدیویی به GPU و در واحد زمان انتقال دهیم که در اکثر موارد تأثیر مثبتی بر عملکرد دارد. از نظر تئوری، یک گذرگاه 256 بیتی می تواند دو برابر بیشتر از یک گذرگاه 128 بیتی در هر سیکل ساعت، داده انتقال دهد. در عمل تفاوت سرعت رندر اگرچه به دو برابر نمی رسد اما در بسیاری از موارد با تاکید بر پهنای باند حافظه ویدئویی بسیار به این نزدیک است.

کارت‌های ویدئویی بازی مدرن از عرض گذرگاه‌های مختلفی استفاده می‌کنند: از 64 تا 384 بیت (قبلا تراشه‌هایی با گذرگاه 512 بیتی وجود داشت)، بسته به محدوده قیمت و زمان انتشار یک مدل GPU خاص. برای ارزان‌ترین کارت‌های ویدئویی ارزان‌قیمت، 64 و کمتر 128 بیت، برای سطح متوسط ​​از 128 تا 256 بیت، و کارت‌های گرافیکی از محدوده قیمت بالا از اتوبوس‌هایی با عرض 256 تا 384 بیت استفاده می‌کنند. عرض گذرگاه دیگر نمی‌تواند صرفاً به دلیل محدودیت‌های فیزیکی رشد کند - اندازه قالب GPU برای قرار دادن بیش از یک گذرگاه 512 بیتی کافی نیست و این بسیار گران است. بنابراین، پهنای باند حافظه در حال حاضر با استفاده از انواع جدید حافظه افزایش یافته است (به زیر مراجعه کنید).

فرکانس حافظه ویدیویی

پارامتر دیگری که بر پهنای باند حافظه تأثیر می گذارد فرکانس ساعت آن است. و افزایش پهنای باند اغلب به طور مستقیم بر عملکرد کارت گرافیک در برنامه های سه بعدی تأثیر می گذارد. فرکانس گذرگاه حافظه در کارت های ویدئویی مدرن از 533 (1066، با احتساب دو برابر شدن) مگاهرتز تا 1375 (5500، با در نظر گرفتن چهار برابر شدن) مگاهرتز متغیر است، یعنی می تواند بیش از پنج برابر متفاوت باشد! و از آنجایی که پهنای باند حافظه هم به فرکانس حافظه و هم به عرض گذرگاه آن بستگی دارد، حافظه با یک گذرگاه 256 بیتی که در فرکانس 800 (3200) مگاهرتز کار می کند، در مقایسه با حافظه ای که در 1000 (4000) مگاهرتز کار می کند، پهنای باند بیشتری خواهد داشت. گذرگاه 128 بیتی.

انواع حافظه

کارت گرافیک های مدرن به انواع مختلف حافظه مجهز هستند. دیگر هیچ جا حافظه تک سرعته SDR قدیمی را پیدا نخواهید کرد، اما انواع مدرن حافظه های DDR و GDDR ویژگی های متفاوتی دارند. انواع مختلف DDR و GDDR به شما این امکان را می دهند که دو یا چهار برابر داده های بیشتری را در یک فرکانس ساعت در واحد زمان انتقال دهید، و بنابراین، رقم فرکانس کاری اغلب دو یا چهار برابر می شود، ضربدر 2 یا 4 می شود. بنابراین، اگر فرکانس مشخص شده باشد. برای حافظه DDR 1400 مگاهرتز، پس این حافظه با فرکانس فیزیکی 700 مگاهرتز کار می کند، اما آنها فرکانس به اصطلاح "موثر" را نشان می دهند، یعنی فرکانسی که حافظه SDR باید در آن کار کند تا پهنای باند یکسانی را ارائه دهد. همان چیزی که در مورد GDDR5 وجود دارد، اما فرکانس آن حتی چهار برابر شده است.

مزیت اصلی انواع جدید حافظه، توانایی کارکرد با سرعت کلاک بالاتر و بر این اساس، افزایش پهنای باند نسبت به فناوری های قبلی است. این به قیمت تاخیرهای افزایش یافته به دست می آید، اما برای کارت های ویدئویی چندان مهم نیستند.

نتیجه این است که هرچه حافظه کارت گرافیک بزرگتر باشد، عملکرد بالاتری دارد. پارامترهای مهم فرکانس کاری باس و عرض باس است. عرض اتوبوس بزرگتر به شما امکان می دهد اطلاعات بیشتری را در واحد زمان از حافظه ویدئویی به GPU و برعکس انتقال دهید. این کار عملکرد کارت گرافیک بیشتر را در شرایط مساوی تضمین می کند. عرض گذرگاه 64-128 بیت برای یک کارت گرافیک ارزان قیمت، 128-256 بیت برای کارت های سطح متوسط، 256-512 بیت برای کارت های پیشرفته است.


1.2 شرح کار و بلوک دیاگرامدستگاه ها

هنگام ساخت تصویر، پس از پردازش سیگنال ویدئویی توسط پردازنده مرکزی، داده ها به گذرگاه داده کارت ویدئو ارسال می شود. سپس داده ها به واحد اجرای دستور موازی و از آن به GPU (پردازنده گرافیکی) ارسال می شود که در آن اقدامات زیر انجام می شود:

· دگرگونی - اشیاء ساده اغلب نیاز به تغییر یا تبدیل به روش خاصی دارند تا یک شی طبیعی تر ایجاد کنند یا حرکت آن را در فضا تقلید کنند. برای این کار، مختصات رئوس وجه های جسم (راس) با استفاده از عملیات جبر ماتریسی و تبدیل های هندسی دوباره محاسبه می شود. در کارت های ویدئویی به شدت برای این منظور استفاده می شود. پردازنده کمکی هندسی.

· محاسبه روشنایی و سایه زنی - برای اینکه یک شی روی صفحه قابل مشاهده باشد، باید میزان روشنایی و سایه هر یک از مستطیل ها یا مثلث های ابتدایی را محاسبه کرد. علاوه بر این، لازم است توزیع واقعی روشنایی شبیه سازی شود، یعنی لازم است تغییرات در روشنایی بین مستطیل ها یا مثلث ها پنهان شود - این توسط واحد Rasterization انجام می شود.

· نقشه برداری بافت - برای ایجاد یک تصویر واقع گرایانه، بافتی که یک سطح واقعی را تقلید می کند به هر سطح ابتدایی اعمال می شود. بافت ها به عنوان تصاویر شطرنجی در حافظه ذخیره می شوند.

· تصحیح عیوب - خطوط و مرزهای شبیه سازی شده اجسام، در صورتی که عمودی یا افقی نباشند، به صورت زاویه ای بر روی صفحه به نظر می رسند، بنابراین تصحیح تصویر انجام می شود که به آن antialiasing می گویند. ضد همخوانی);

پس از پردازش GPU، اشیاء توسط بلوک "Z-buffer" پردازش می شوند:

· پروجکشن - یک جسم سه بعدی به یک جسم دو بعدی تبدیل می شود، اما در عین حال فواصل رئوس چهره ها تا سطح صفحه نمایش (مختصات Z، Z-بافر) که جسم روی آن پرتاب می شود. به یاد می آورند؛

· حذف سطوح پنهان - تمام سطوح نامرئی را از یک طرح 2 بعدی یک شی 3 بعدی حذف می کند.

پس از محاسبه تمام نقاط قاب، اطلاعات مربوط به هر پیکسل به حافظه ویدئویی منتقل می شود.

در بلوک کنترل پالت و پوشش تصویر، رنگ‌های از دست رفته درون یابی می‌شوند - اگر هنگام مدل‌سازی اشیاء از تعداد رنگ‌های متفاوتی نسبت به حالت کارت ویدیوی فعلی استفاده شده باشد، باید رنگ‌های گمشده را محاسبه کرد یا رنگ‌های اضافی را حذف کرد.

اگر کارت گرافیک به یک مانیتور مبتنی بر یک لوله اشعه کاتدی متصل شود، داده ها به یک DAC (مبدل دیجیتال به آنالوگ) می روند که در آن سیگنال های دیجیتال به سیگنال های RGB آنالوگ قابل درک برای مانیتور تبدیل می شوند.

اگر کارت گرافیک به یک مانیتور دیجیتال متصل شود، اطلاعات تصویر به فرمت صفحه نمایش مانیتور تبدیل می شود.

اجزای اصلی کارت گرافیک:

  • خروجی ها
  • رابط ها
  • سیستم خنک کننده؛
  • پردازنده گرافیکی
  • حافظه ویدیویی

فناوری های گرافیکی:

  • فرهنگ لغت؛
  • معماری GPU: ویژگی ها
    واحدهای رأس/پیکسل، شیدرها، نرخ پر شدن، واحدهای بافت/راستر، خطوط لوله.
  • معماری GPU: فناوری
    فرآیند فنی، فرکانس GPU، حافظه ویدئویی محلی (حجم، اتوبوس، نوع، فرکانس)، راه حل هایی با چندین کارت گرافیک؛
  • توابع بصری
    DirectX، محدوده دینامیکی بالا (HDR)، ضد آلیاسینگ تمام صفحه، فیلتر بافت، بافت های با وضوح بالا.

واژه نامه اصطلاحات گرافیکی پایه

نرخ تازه سازی

درست مانند یک سینما یا تلویزیون، کامپیوتر شما با نمایش متوالی فریم ها، حرکت را روی مانیتور شبیه سازی می کند. نرخ تازه سازی مانیتور نشان می دهد که تصویر روی صفحه چند بار در ثانیه به روز می شود. به عنوان مثال، فرکانس 75 هرتز مربوط به 75 به روز رسانی در ثانیه است.

اگر رایانه فریم‌ها را سریع‌تر از مانیتور پردازش کند، ممکن است مشکلاتی در بازی‌ها رخ دهد. به عنوان مثال، اگر رایانه 100 فریم در ثانیه رندر می‌کند و نرخ تازه‌سازی مانیتور 75 هرتز است، به دلیل همپوشانی‌ها، مانیتور تنها می‌تواند بخشی از تصویر را در طول دوره تازه‌سازی خود نمایش دهد. در نتیجه، مصنوعات بصری ظاهر می شوند.

به عنوان یک راه حل، می توانید V-Sync (همگام سازی عمودی) را فعال کنید. این تعداد فریم هایی را که رایانه می تواند تولید کند به نرخ تازه سازی مانیتور محدود می کند و از ایجاد مصنوعات جلوگیری می کند. اگر V-Sync را فعال کنید، تعداد فریم های محاسبه شده در بازی هرگز از نرخ تازه سازی بیشتر نخواهد شد. یعنی در 75 هرتز کامپیوتر بیش از 75 فریم در ثانیه خروجی نخواهد داشت.

پیکسل

کلمه "Pixel" مخفف " عکس ture elعنصر" - عنصر تصویر. این یک نقطه کوچک روی صفحه نمایش است که می تواند در یک رنگ خاص بدرخشد (در بیشتر موارد، رنگ با ترکیبی از سه رنگ اصلی: قرمز، سبز و آبی نمایش داده می شود). اگر وضوح صفحه نمایش 1024x768 باشد، می توانید ماتریسی از 1024 پیکسل در عرض و 768 پیکسل در ارتفاع را مشاهده کنید. همه پیکسل ها با هم تصویر را تشکیل می دهند. بسته به نوع نمایشگر و خروجی داده از کارت ویدئو، تصویر روی صفحه از 60 تا 120 بار در ثانیه به روز می شود. مانیتورهای CRT صفحه نمایش را خط به خط تازه می کنند، در حالی که مانیتورهای LCD با صفحه تخت می توانند هر پیکسل را به صورت جداگانه تازه کنند.

راس

تمام اشیاء در یک صحنه سه بعدی از رئوس تشکیل شده اند. راس نقطه‌ای در فضای سه‌بعدی با مختصات X، Y و Z است. چندین راس را می‌توان در یک چندضلعی گروه‌بندی کرد: اغلب یک مثلث است، اما تعداد بیشتری نیز ممکن است. اشکال پیچیده. سپس یک بافت بر روی چند ضلعی اعمال می شود که باعث می شود شی واقع گرایانه به نظر برسد. مکعب سه بعدی نشان داده شده در تصویر بالا از هشت راس تشکیل شده است. اجسام پیچیده تر دارای سطوح منحنی هستند که در واقع از تعداد بسیار زیادی رئوس تشکیل شده اند.

بافت

بافت به سادگی یک تصویر دو بعدی با اندازه دلخواه است که برای شبیه سازی سطح آن بر روی یک شی سه بعدی نگاشت می شود. به عنوان مثال، مکعب سه بعدی ما از هشت راس تشکیل شده است. قبل از اعمال بافت، مانند یک جعبه ساده به نظر می رسد. اما وقتی بافت را اعمال می کنیم، جعبه رنگی می شود.

سایه بان

برنامه‌های سایه‌زن پیکسل به کارت ویدیو اجازه می‌دهند تا جلوه‌های چشمگیری تولید کند، برای مثال، مانند آب در Elder Scrolls: Oblivion.

امروزه دو نوع سایه زن وجود دارد: راس و پیکسل. برنامه های سایه زن Vertex می توانند اشیاء سه بعدی را تغییر داده یا تبدیل کنند. برنامه های سایه زن پیکسل به شما امکان می دهند رنگ پیکسل ها را بر اساس برخی داده ها تغییر دهید. یک منبع نور را در یک صحنه سه بعدی تصور کنید که باعث می شود اشیاء نورانی درخشان تر بدرخشند و در عین حال باعث ایجاد سایه بر روی اشیاء دیگر شود. همه اینها با تغییر اطلاعات رنگ پیکسل ها به دست می آید.

سایه زن پیکسل برای ایجاد جلوه های پیچیده در بازی های مورد علاقه شما استفاده می شود. به عنوان مثال، کد سایه زن می تواند پیکسل های اطراف یک شمشیر سه بعدی را درخشان تر کند. سایه زن دیگر می تواند تمام رئوس یک شی پیچیده سه بعدی را پردازش کرده و یک انفجار را شبیه سازی کند. توسعه دهندگان بازی به طور فزاینده ای به برنامه های سایه زن پیچیده برای ایجاد گرافیک واقعی روی می آورند. تقریباً هر بازی مدرن با گرافیک غنی از شیدرها استفاده می کند.

با انتشار رابط برنامه نویسی برنامه (API) بعدی مایکروسافت DirectX 10، نوع سوم سایه زن به نام geometry shader منتشر خواهد شد. با کمک آنها، بسته به نتیجه مورد نظر، شکستن اشیاء، اصلاح و حتی از بین بردن آنها امکان پذیر خواهد بود. نوع سوم شیدرها را می توان دقیقاً به همان روشی که دو مورد اول برنامه ریزی کرد، اما نقش آن متفاوت خواهد بود.

نرخ پر کردن

اغلب در جعبه کارت گرافیک می توانید مقدار نرخ پر شدن را پیدا کنید. اساساً نرخ پر شدن نشان می دهد که GPU با چه سرعتی می تواند پیکسل ها را خروجی دهد. کارت‌های ویدئویی قدیمی‌تر دارای نرخ پر شدن مثلث بودند. اما امروزه دو نوع نرخ پر شدن وجود دارد: میزان پر شدن پیکسل و نرخ پر شدن بافت. همانطور که قبلا ذکر شد، نرخ پر شدن پیکسل با نرخ خروجی پیکسل مطابقت دارد. به عنوان تعداد عملیات شطرنجی (ROP) ضرب در فرکانس ساعت محاسبه می شود.

نرخ پر شدن بافت توسط ATi و nVidia متفاوت محاسبه می شود. انویدیا معتقد است که سرعت با ضرب تعداد خطوط لوله پیکسل در فرکانس ساعت به دست می آید. و ATi تعداد واحدهای بافت را در سرعت ساعت ضرب می کند. در اصل، هر دو روش صحیح هستند، زیرا nVidia از یک واحد بافت در هر واحد سایه زن استفاده می کند (یعنی یک واحد در هر خط لوله پیکسل).

با در نظر گرفتن این تعاریف، اجازه دهید به ادامه مطلب برویم و مهم ترین عملکردهای GPU، کارهایی که انجام می دهند و چرا اینقدر مهم هستند را مورد بحث قرار دهیم.

معماری GPU: ویژگی ها

واقعی بودن گرافیک سه بعدی تا حد زیادی به عملکرد کارت گرافیک بستگی دارد. هرچه تعداد بلوک‌های سایه‌زن پیکسلی پردازنده بیشتر باشد و فرکانس آن بیشتر باشد، می‌توان جلوه‌های بیشتری را روی صحنه سه‌بعدی اعمال کرد تا درک بصری آن را بهبود بخشد.

GPU شامل بسیاری از بلوک های عملکردی مختلف است. با تعداد برخی از اجزا، می توانید تخمین بزنید که GPU چقدر قدرتمند است. قبل از حرکت بیشتر، اجازه دهید مهم ترین بلوک های کاربردی را مرور کنیم.

پردازنده های راس (واحد سایه زن راس)

مانند واحدهای سایه زن پیکسل، پردازنده های راس کد سایه زن را اجرا می کنند که رئوس را لمس می کند. از آنجایی که بودجه راس بزرگتر امکان ایجاد اشیاء سه بعدی پیچیده تر را فراهم می کند، عملکرد پردازنده های راس در صحنه های سه بعدی با تعداد اشیاء پیچیده یا زیاد بسیار مهم است. با این حال، واحدهای سایه زن راس هنوز هم مانند پردازنده‌های پیکسل تأثیر آشکاری بر عملکرد ندارند.

پردازنده های پیکسل (واحد سایه زن پیکسل)

پردازنده پیکسلی جزء یک تراشه گرافیکی است که به پردازش برنامه های سایه زن پیکسل اختصاص داده شده است. این پردازنده ها محاسباتی را انجام می دهند که فقط به پیکسل ها مربوط می شود. از آنجایی که پیکسل ها حاوی اطلاعات رنگی هستند، سایه زن های پیکسل به شما اجازه می دهد تا جلوه های گرافیکی چشمگیری داشته باشید. به عنوان مثال، بیشتر افکت های آبی که در بازی ها می بینید با استفاده از سایه زن های پیکسل ایجاد می شوند. به طور معمول، تعداد پردازنده های پیکسل برای مقایسه عملکرد پیکسل کارت های ویدئویی استفاده می شود. اگر یک کارت دارای هشت واحد سایه زن پیکسل و دیگری دارای 16 واحد باشد، منطقی است که فرض کنیم یک کارت گرافیک با 16 واحد در پردازش برنامه های سایه زن پیچیده پیکسل سریعتر خواهد بود. سرعت کلاک را نیز باید در نظر گرفت، اما امروزه دوبرابر کردن تعداد پردازنده‌های پیکسلی نسبت به دو برابر کردن فرکانس تراشه‌های گرافیکی، صرفه‌جویی در مصرف انرژی دارد.

شیدرهای یکپارچه

شیدرهای یکپارچه هنوز وارد دنیای رایانه های شخصی نشده اند، اما استاندارد آتی DirectX 10 مبتنی بر معماری مشابهی است. یعنی ساختار کد برنامه های رأس، هندسه و پیکسل یکسان خواهد بود، اگرچه سایه بان ها کار متفاوتی را انجام می دهند. مشخصات جدید را می توان در Xbox 360 مشاهده کرد، جایی که GPU به طور ویژه توسط ATi برای مایکروسافت طراحی شده است. دیدن اینکه DirectX 10 جدید چه پتانسیل هایی را به همراه دارد بسیار جالب خواهد بود.

واحدهای نقشه برداری بافت (TMU)

بافت ها باید انتخاب و فیلتر شوند. این کار توسط واحدهای نگاشت بافت انجام می شود که در ارتباط با واحدهای سایه زن پیکسل و رأس کار می کنند. وظیفه TMU اعمال عملیات بافت بر روی پیکسل ها است. تعداد واحدهای بافت در یک GPU اغلب برای مقایسه عملکرد بافت کارت‌های ویدئویی استفاده می‌شود. منطقی است که فرض کنیم یک کارت گرافیک با TMU های بیشتر، عملکرد بافت بهتری را ارائه می دهد.

واحدهای اپراتور رستر (ROP)

پردازنده های رستر وظیفه نوشتن داده های پیکسلی در حافظه را بر عهده دارند. سرعتی که این عملیات با آن انجام می شود، نرخ پر شدن است. در روزهای اولیه شتاب دهنده های سه بعدی، ROP و نرخ پر شدن از ویژگی های بسیار مهم کارت های ویدئویی بودند. امروزه، کار ROP هنوز مهم است، اما عملکرد کارت گرافیک دیگر مانند گذشته توسط این بلوک ها محدود نمی شود. بنابراین، عملکرد (و تعداد) ROP به ندرت برای ارزیابی سرعت یک کارت گرافیک استفاده می شود.

نوار نقاله

خطوط لوله برای توصیف معماری کارت های ویدئویی و ارائه یک ایده بسیار واضح از عملکرد GPU استفاده می شود.

نوار نقاله را نمی توان یک اصطلاح فنی دقیق در نظر گرفت. GPU از خطوط لوله مختلفی استفاده می کند که عملکردهای مختلفی را انجام می دهند. از لحاظ تاریخی، خط لوله به معنای یک پردازنده پیکسلی بود که به واحد نقشه برداری بافت (TMU) متصل بود. به عنوان مثال، کارت گرافیک Radeon 9700 از هشت پردازنده پیکسل استفاده می کند که هر کدام به TMU خود متصل هستند، بنابراین کارت دارای هشت خط لوله در نظر گرفته می شود.

اما توصیف پردازنده های مدرن با تعداد خطوط لوله بسیار دشوار است. در مقایسه با طراحی های قبلی، پردازنده های جدید از ساختار ماژولار و تکه تکه استفاده می کنند. ATi را می توان یک مبتکر در این زمینه در نظر گرفت که با خط کارت گرافیک X1000 به ساختار ماژولار تبدیل شد که امکان دستیابی به دستاوردهای عملکرد را از طریق بهینه سازی داخلی ممکن کرد. برخی از بلوک‌های CPU بیشتر از سایرین استفاده می‌شوند و برای بهبود عملکرد GPU، ATi سعی کرده است بین تعداد بلوک‌های مورد نیاز و ناحیه Die (که نمی‌توان آن را زیاد افزایش داد) سازش پیدا کند. در این معماری، اصطلاح "pixel pipeline" معنای خود را از دست داده است، زیرا پردازنده های پیکسل دیگر به TMU های خود متصل نیستند. به عنوان مثال، پردازنده گرافیکی ATi Radeon X1600 دارای 12 واحد سایه زن و تنها چهار واحد نقشه برداری بافت TMU است. بنابراین، نمی توان گفت که معماری این پردازنده دارای 12 پیکسل پیکسل است، همانطور که نمی توان گفت که تنها چهار مورد از آنها وجود دارد. با این حال، طبق سنت، خطوط لوله پیکسل هنوز هم ذکر شده است.

با در نظر گرفتن مفروضات فوق، تعداد خطوط لوله پیکسل در یک GPU اغلب برای مقایسه کارت های ویدئویی (به استثنای خط ATi X1x00) استفاده می شود. به عنوان مثال، اگر کارت‌های ویدئویی را با خط لوله 24 و 16 می‌گیرید، کاملاً منطقی است که فرض کنیم کارت با 24 خط لوله سریع‌تر خواهد بود.

معماری GPU: فناوری

فرآیند فنی

این اصطلاح به اندازه یک عنصر (ترانزیستور) تراشه و دقت فرآیند ساخت اشاره دارد. بهبود در فرآیندهای فنی امکان به دست آوردن عناصر با اندازه کوچکتر را فراهم می کند. به عنوان مثال، فرآیند فنی 0.18 میکرون عناصر را تولید می کند اندازه بزرگترنسبت به فناوری فرآیند 0.13 میکرومتر، بنابراین آنقدر کارآمد نیست. ترانزیستورهای کوچکتر با ولتاژ کمتر کار می کنند. به نوبه خود، کاهش ولتاژ منجر به کاهش مقاومت حرارتی می شود که منجر به کاهش مقدار گرمای تولید شده می شود. بهبود در فرآیند فنی امکان کاهش فاصله بین بلوک های عملکردی تراشه را فراهم می کند و انتقال داده ها به زمان کمتری نیاز دارد. فواصل کوتاه تر، ولتاژهای کمتر و سایر پیشرفت ها امکان دستیابی به سرعت کلاک بالاتر را فراهم می کند.

آنچه درک را تا حدودی پیچیده می کند این است که امروزه از هر دو میکرومتر (μm) و نانومتر (nm) برای تعیین یک فرآیند فنی استفاده می شود. در واقع، همه چیز بسیار ساده است: 1 نانومتر برابر با 0.001 میکرومتر است، بنابراین فرآیندهای 0.09 میکرومتر و 90 نانومتر یکسان هستند. همانطور که در بالا ذکر شد، یک فناوری فرآیند کوچکتر امکان سرعت ساعت بالاتر را فراهم می کند. به عنوان مثال، اگر کارت‌های ویدیویی را با تراشه‌های 0.18 میکرون و 0.09 میکرون (90 نانومتر) مقایسه کنیم، انتظار فرکانس بالاتر از یک کارت 90 نانومتری کاملاً منطقی است.

سرعت ساعت GPU

سرعت ساعت GPU با مگاهرتز (MHz) اندازه گیری می شود که میلیون ها سیکل ساعت در ثانیه است.

سرعت ساعت به طور مستقیم بر عملکرد GPU تأثیر می گذارد. هر چه بالاتر باشد، در یک ثانیه کار بیشتری می توان انجام داد. برای مثال اول، کارت گرافیک nVidia GeForce 6600 و 6600 GT را در نظر می گیریم: GPU 6600 GT با فرکانس 500 مگاهرتز کار می کند، در حالی که کارت 6600 معمولی با فرکانس 400 مگاهرتز کار می کند. از آنجایی که پردازنده ها از نظر فنی یکسان هستند، افزایش 20 درصدی در سرعت ساعت در 6600 GT منجر به عملکرد بالاتر می شود.

اما سرعت ساعت همه چیز نیست. به خاطر داشته باشید که عملکرد تا حد زیادی تحت تاثیر معماری است. برای مثال دوم، کارت گرافیک GeForce 6600 GT و GeForce 6800 GT را در نظر بگیرید. پردازنده گرافیکی 6600 GT با فرکانس 500 مگاهرتز کار می کند، اما 6800 GT تنها با فرکانس 350 مگاهرتز کار می کند. حال بیایید در نظر بگیریم که 6800 GT از 16 پیکسل استفاده می کند، در حالی که 6600 GT تنها از هشت پیکسل استفاده می کند. بنابراین، یک 6800 GT با 16 خط لوله در فرکانس 350 مگاهرتز تقریباً همان عملکرد یک پردازنده با هشت خط لوله و دو برابر سرعت کلاک (700 مگاهرتز) را دارد. با این گفته، سرعت ساعت را می توان به راحتی برای مقایسه عملکرد استفاده کرد.

حافظه ویدئویی محلی

حافظه کارت گرافیک تا حد زیادی بر عملکرد تأثیر می گذارد. اما پارامترهای مختلف حافظه اثرات متفاوتی دارند.

اندازه حافظه ویدیویی

احتمالاً می توان مقدار حافظه ویدیویی را بیش از حد برآورد شده ترین پارامتر یک کارت گرافیک نامید. مصرف کنندگان بی تجربه اغلب از ظرفیت حافظه ویدیویی برای مقایسه کارت های مختلف با یکدیگر استفاده می کنند، اما در واقعیت، ظرفیت در مقایسه با پارامترهایی مانند فرکانس گذرگاه حافظه و رابط (عرض باس) تأثیر کمی بر عملکرد دارد.

در بیشتر موارد، کارتی با 128 مگابایت حافظه ویدئویی تقریباً مشابه کارت با 256 مگابایت عمل می کند. البته، شرایطی وجود دارد که حافظه بیشتر باعث بهبود عملکرد می شود، اما به خاطر داشته باشید که حافظه بیشتر به طور خودکار منجر به افزایش سرعت بازی نمی شود.

جایی که حجم می تواند مفید باشد در بازی هایی با بافت های با وضوح بالا است. توسعه دهندگان بازی چندین مجموعه از بافت ها را برای بازی ارائه می دهند. و هرچه حافظه روی کارت گرافیک بیشتر باشد، بافت های بارگذاری شده وضوح بیشتری می توانند داشته باشند. بافت های با وضوح بالا وضوح و جزئیات بیشتری را در بازی ارائه می دهند. بنابراین، اگر همه معیارهای دیگر مطابقت داشته باشند، گرفتن کارتی با مقدار حافظه زیاد کاملاً منطقی است. اجازه دهید یک بار دیگر به شما یادآوری کنیم که عرض گذرگاه حافظه و فرکانس آن تأثیر بسیار قوی تری بر عملکرد نسبت به میزان حافظه فیزیکی روی کارت دارد.

عرض گذرگاه حافظه

عرض گذرگاه حافظه یکی از مهمترین جنبه های عملکرد حافظه است. باس های مدرن از 64 تا 256 بیت و در برخی موارد حتی 512 بیت متغیر هستند. هرچه گذرگاه حافظه عریض تر باشد، اطلاعات بیشتری می تواند در هر سیکل ساعت منتقل کند. و این به طور مستقیم بر بهره وری تاثیر می گذارد. به عنوان مثال، اگر دو اتوبوس با فرکانس های مساوی را انتخاب کنید، از نظر تئوری یک گذرگاه 128 بیتی دو برابر بیشتر از یک گذرگاه 64 بیتی در هر سیکل ساعت، داده انتقال می دهد. و گذرگاه 256 بیتی دو برابر بزرگتر است.

پهنای باند گذرگاه بالاتر (بیان شده در بیت یا بایت در ثانیه، 1 بایت = 8 بیت) عملکرد حافظه بالاتری را ارائه می دهد. به همین دلیل است که گذرگاه حافظه بسیار مهمتر از اندازه آن است. در فرکانس های مساوی، گذرگاه حافظه 64 بیتی تنها با سرعت 25 درصد از 256 بیتی کار می کند!

بیایید مثال زیر را در نظر بگیریم. کارت گرافیک با 128 مگابایت حافظه ویدئویی، اما با گذرگاه 256 بیتی، عملکرد حافظه بسیار بالاتری نسبت به مدل 512 مگابایتی با گذرگاه 64 بیتی ارائه می دهد. توجه به این نکته ضروری است که برای برخی از کارت های خط ATi X1x00، سازندگان مشخصات گذرگاه حافظه داخلی را نشان می دهند، اما ما به پارامترهای گذرگاه خارجی علاقه مند هستیم. به عنوان مثال، X1600 دارای یک گذرگاه حلقه داخلی با عرض 256 بیت است، اما یک گذرگاه خارجی که تنها 128 بیت عرض دارد. و در واقع، گذرگاه حافظه با عملکرد 128 بیتی کار می کند.

انواع حافظه

حافظه را می توان به دو دسته اصلی تقسیم کرد: SDR (انتقال تک داده) و DDR (انتقال دوگانه داده) که در آن داده ها در هر سیکل ساعت دو برابر سریعتر منتقل می شوند. امروزه فناوری SDR انتقال تک منسوخ شده است. از آنجایی که حافظه DDR داده ها را دو برابر سریعتر از SDR منتقل می کند، مهم است که به یاد داشته باشید که کارت های ویدیویی با حافظه DDR اغلب فرکانس دو برابر را نشان می دهند نه فرکانس فیزیکی. به عنوان مثال، اگر حافظه DDR روی 1000 مگاهرتز مشخص شده باشد، این فرکانس موثری است که حافظه SDR معمولی باید در آن کار کند تا توان عملیاتی مشابهی داشته باشد. اما در واقع فرکانس فیزیکی 500 مگاهرتز است.

به همین دلیل، هنگامی که فرکانس 1200 مگاهرتز DDR برای حافظه کارت گرافیک آنها نشان داده می شود، بسیاری تعجب می کنند و شرکت های خدماتی 600 مگاهرتز را گزارش می دهند. بنابراین باید به آن عادت کنید. حافظه‌های DDR2 و GDDR3/GDDR4 بر اساس یک اصل کار می‌کنند، یعنی با انتقال اطلاعات مضاعف. تفاوت بین حافظه های DDR، DDR2، GDDR3 و GDDR4 در فناوری تولید و برخی جزئیات نهفته است. DDR2 می تواند در فرکانس های بالاتر از حافظه DDR کار کند و DDR3 می تواند حتی در فرکانس های بالاتر از DDR2 کار کند.

فرکانس باس حافظه

مانند یک پردازنده، حافظه (یا به طور دقیق تر، گذرگاه حافظه) با سرعت ساعت خاصی که بر حسب مگاهرتز اندازه گیری می شود، کار می کند. در اینجا، افزایش سرعت ساعت به طور مستقیم بر عملکرد حافظه تأثیر می گذارد. و فرکانس گذرگاه حافظه یکی از پارامترهایی است که برای مقایسه عملکرد کارت های ویدئویی استفاده می شود. به عنوان مثال، اگر همه مشخصات دیگر (عرض گذرگاه حافظه و غیره) یکسان باشند، کاملاً منطقی است که بگوییم یک کارت گرافیک با حافظه 700 مگاهرتز سریعتر از کارت گرافیک با حافظه 500 مگاهرتز است.

باز هم، سرعت ساعت همه چیز نیست. حافظه 700 مگاهرتز با گذرگاه 64 بیتی کندتر از حافظه 400 مگاهرتز با گذرگاه 128 بیتی خواهد بود. عملکرد حافظه 400 مگاهرتز در یک گذرگاه 128 بیتی تقریباً معادل حافظه 800 مگاهرتز در یک گذرگاه 64 بیتی است. همچنین باید به یاد داشته باشید که فرکانس‌های GPU و حافظه پارامترهای کاملاً متفاوتی هستند و معمولاً متفاوت هستند.

رابط کارت گرافیک

تمام داده های منتقل شده بین کارت گرافیک و پردازنده از طریق رابط کارت گرافیک می گذرد. امروزه از سه نوع رابط برای کارت های ویدئویی استفاده می شود: PCI، AGP و PCI Express. آنها از نظر پهنای باند و سایر مشخصات متفاوت هستند. واضح است که هر چه توان عملیاتی بیشتر باشد، سرعت مبادله نیز بیشتر می شود. با این حال، فقط مدرن‌ترین کارت‌ها می‌توانند از پهنای باند بالا و حتی در آن صورت فقط تا حدی استفاده کنند. در برخی مواقع، سرعت رابط امروز به سادگی کافی نیست.

کندترین اتوبوسی که برای آن کارت‌های ویدئویی تولید شده‌اند PCI (Peripheral Components Interconnect) است. البته بدون ورود به تاریخ. PCI واقعاً عملکرد کارت‌های ویدیویی را کاهش داد، بنابراین آنها به رابط AGP (درگاه گرافیکی شتاب‌دار) تغییر مکان دادند. اما حتی مشخصات AGP 1.0 و 2x نیز عملکرد را محدود می کند. هنگامی که استاندارد سرعت را به سطوح AGP 4x افزایش داد، ما شروع به نزدیک شدن به محدودیت عملی پهنای باندی که کارت‌های ویدئویی می‌توانند از عهده آن برآیند، شدیم. مشخصات AGP 8x بار دیگر توان عملیاتی را در مقایسه با AGP 4x (2.16 گیگابایت بر ثانیه) دو برابر کرد، اما دیگر افزایش قابل توجهی در عملکرد گرافیکی دریافت نکردیم.

جدیدترین و سریعترین اتوبوس PCI Express است. کارت‌های گرافیک جدید معمولاً از رابط PCI Express x16 استفاده می‌کنند که 16 خط PCI Express را برای خروجی کل 4 گیگابایت بر ثانیه (یک جهت) ترکیب می‌کند. این دو برابر توان عملیاتی AGP 8x است. گذرگاه PCI Express پهنای باند ذکر شده را در هر دو جهت (انتقال داده به و از کارت گرافیک) فراهم می کند. اما سرعت استاندارد AGP 8x قبلاً کافی بود، بنابراین ما هنوز با وضعیتی مواجه نشده‌ایم که تعویض به PCI Express باعث افزایش عملکرد در مقایسه با AGP 8x شود (اگر سایر پارامترهای سخت‌افزاری یکسان باشند). به عنوان مثال، نسخه AGP GeForce 6800 Ultra همانند 6800 Ultra برای PCI Express کار خواهد کرد.

امروزه بهتر است کارتی با رابط PCI Express بخرید که چندین سال دیگر در بازار باقی بماند. قدرتمندترین کارت ها دیگر با رابط AGP 8x تولید نمی شوند و راه حل های PCI Express معمولاً راحت تر از آنالوگ های AGP یافت می شوند و ارزان تر هستند.

راه حل در کارت های ویدئویی متعدد

استفاده از چندین کارت گرافیک برای افزایش عملکرد گرافیکی ایده جدیدی نیست. در روزهای اولیه گرافیک سه بعدی، 3dfx با دو کارت گرافیک به صورت موازی وارد بازار شد. اما با ناپدید شدن 3dfx، فناوری چند کارت گرافیک مصرف کننده برای کار با یکدیگر به فراموشی سپرده شد، اگرچه ATi از زمان عرضه Radeon 9700 سیستم های مشابهی را برای شبیه سازهای حرفه ای تولید می کرد. چند سال پیش، این فناوری به بازار: با ظهور راه حل های nVidia SLI و کمی بعد، ATi Crossfire.

استفاده از چندین کارت گرافیک با هم عملکرد کافی برای اجرای بازی با تنظیمات با کیفیت بالا و وضوح بالا را فراهم می کند. اما انتخاب یک راه حل یا راه حل دیگر چندان ساده نیست.

بیایید با این واقعیت شروع کنیم که راه حل های مبتنی بر چندین کارت گرافیک به مقدار زیادی انرژی نیاز دارند، بنابراین منبع تغذیه باید به اندازه کافی قدرتمند باشد. تمام این گرما باید از کارت گرافیک حذف شود، بنابراین باید به کیس کامپیوتر و خنک کننده توجه کنید تا سیستم بیش از حد گرم نشود.

همچنین، به یاد داشته باشید که SLI/CrossFire به یک مادربرد مناسب (چه برای یک فناوری یا دیگری) نیاز دارد، که معمولاً هزینه بیشتری نسبت به مدل‌های استاندارد دارد. پیکربندی nVidia SLI فقط روی بردهای خاص nForce4 کار می‌کند و کارت‌های ATi CrossFire فقط روی مادربردهایی با چیپست CrossFire یا مدل‌های خاص اینتل کار می‌کنند. برای پیچیده تر کردن مسائل، برخی از پیکربندی های CrossFire نیاز دارند که یکی از کارت ها یک کارت خاص باشد: CrossFire Edition. پس از انتشار CrossFire، برای برخی از مدل‌های کارت‌های ویدئویی، ATi اجازه گنجاندن فناوری همکاری از طریق گذرگاه PCI Express را داد و با انتشار نسخه‌های درایور جدید، تعداد ترکیب‌های ممکن افزایش می‌یابد. اما همچنان، CrossFire سخت افزاری با کارت مربوطه CrossFire Edition عملکرد بالاتری را ارائه می دهد. اما کارت های CrossFire Edition نیز گران تر از مدل های معمولی هستند. در حال حاضر، می توانید حالت CrossFire نرم افزاری (بدون کارت CrossFire Edition) را روی کارت های گرافیک Radeon X1300، X1600 و X1800 GTO فعال کنید.

عوامل دیگری نیز وجود دارد که باید در نظر گرفته شود. اگرچه دو کارت گرافیک با هم کار می کنند، عملکرد را افزایش می دهند، اما دو برابر نیست. اما شما دو برابر پول پرداخت خواهید کرد. اغلب، افزایش بهره وری 20-60٪ است. و در برخی موارد به دلیل هزینه های محاسباتی اضافی برای تطبیق، هیچ افزایشی وجود ندارد. به همین دلیل، بعید است که پیکربندی‌های چند کارتی با مدل‌های ارزان‌تر ارزش داشته باشند، زیرا کارت گرافیک گران‌تر معمولاً همیشه از چند کارت ارزان‌تر بهتر است. به طور کلی، برای اکثر مصرف کنندگان، خرید راه حل SLI/CrossFire منطقی نیست. اما اگر می‌خواهید همه گزینه‌های بهبود کیفیت را فعال کنید یا با وضوح‌های فوق‌العاده بازی کنید، به عنوان مثال، 2560x1600، زمانی که باید بیش از 4 میلیون پیکسل در هر فریم را محاسبه کنید، بدون دو یا چهار کارت ویدیوی جفت نمی‌توانید کار کنید.

ویژگی های بصری

علاوه بر مشخصات سخت افزاری، نسل ها و مدل های مختلف پردازنده های گرافیکی ممکن است در مجموعه عملکردها متفاوت باشند. به عنوان مثال، اغلب گفته می شود که کارت های نسل ATi Radeon X800 XT با Shader Model 2.0b (SM) سازگار هستند، در حالی که nVidia GeForce 6800 Ultra با SM 3.0 سازگار است، اگرچه مشخصات سخت افزاری آنها به یکدیگر نزدیک است (16 خط لوله). ). بنابراین، بسیاری از مصرف کنندگان به نفع یک راه حل یا راه حل دیگر انتخاب می کنند بدون اینکه حتی بدانند تفاوت به چه معناست.

نسخه های Microsoft DirectX و Shader Model

این نام ها اغلب در اختلافات استفاده می شود، اما تعداد کمی از مردم معنی واقعی آنها را می دانند. برای درک، بیایید با تاریخچه APIهای گرافیکی شروع کنیم. DirectX و OpenGL APIهای گرافیکی هستند، یعنی رابط های برنامه نویسی برنامه - استانداردهای کد باز در دسترس همه هستند.

قبل از ظهور APIهای گرافیکی، هر سازنده GPU از آن استفاده می کرد مکانیزم خودارتباط با بازی ها توسعه دهندگان باید برای هر پردازنده گرافیکی که می خواستند از آن پشتیبانی کنند، کد جداگانه بنویسند. روشی بسیار پرهزینه و بی اثر. برای حل این مشکل، API هایی برای گرافیک های سه بعدی توسعه داده شد تا توسعه دهندگان کد را برای یک API خاص بنویسند، نه برای یک کارت گرافیک خاص. پس از آن، مشکلات سازگاری بر دوش سازندگان کارت گرافیک افتاد، که باید اطمینان حاصل می کردند که درایورها با API سازگار هستند.

تنها مشکل این است که امروزه از دو API مختلف استفاده می‌شود، یعنی Microsoft DirectX و OpenGL که GL مخفف Graphics Library است. از آنجایی که DirectX API امروزه در بازی ها محبوبیت بیشتری دارد، ما روی آن تمرکز خواهیم کرد. و این استاندارد تأثیر قوی تری در توسعه بازی ها داشت.

DirectX ساخته مایکروسافت است. در واقع DirectX شامل چندین API است که تنها یکی از آنها برای گرافیک سه بعدی استفاده می شود. DirectX شامل APIهایی برای صدا، موسیقی، دستگاه های ورودی و غیره است. Direct3D API وظیفه گرافیک سه بعدی در DirectX را بر عهده دارد. هنگامی که آنها در مورد کارت های ویدئویی صحبت می کنند، منظور آنها این است، بنابراین از این نظر مفاهیم DirectX و Direct3D قابل تعویض هستند.

با پیشرفت فناوری گرافیک و توسعه دهندگان بازی و اجرای تکنیک های جدید برنامه نویسی بازی، DirectX به طور دوره ای به روز می شود. همانطور که DirectX به سرعت در محبوبیت رشد کرد، تولید کنندگان GPU شروع به طراحی نسخه های جدید محصولات برای تطبیق با قابلیت های DirectX کردند. به همین دلیل، کارت‌های ویدیویی اغلب به پشتیبانی سخت‌افزاری برای یک یا آن نسل از DirectX (DirectX 8، 9.0 یا 9.0c) متصل می‌شوند.

برای پیچیده تر کردن مسائل، بخش هایی از Direct3D API می توانند در طول زمان بدون تغییر نسل های DirectX تغییر کنند. به عنوان مثال، مشخصات DirectX 9.0 پشتیبانی از Pixel Shader 2.0 را مشخص می کند. اما به روز رسانی DirectX 9.0c شامل Pixel Shader 3.0 می شود. بنابراین، اگرچه کارت ها از کلاس 9 DirectX هستند، اما ممکن است از مجموعه ویژگی های مختلفی پشتیبانی کنند. به عنوان مثال، Radeon 9700 از Shader Model 2.0 و Radeon X1800 از Shader Model 3.0 پشتیبانی می کند، اگرچه هر دو کارت را می توان به عنوان نسل DirectX 9 طبقه بندی کرد.

به یاد داشته باشید که هنگام ایجاد بازی های جدید، توسعه دهندگان صاحبان ماشین ها و کارت های ویدئویی قدیمی را در نظر می گیرند، زیرا اگر این بخش از کاربران را نادیده بگیرید، سطح فروش پایین تر خواهد بود. به همین دلیل، مسیرهای کد متعددی در بازی ها تعبیه شده است. یک بازی کلاس DirectX 9 احتمالاً دارای مسیر DirectX 8 و حتی مسیر DirectX 7 برای سازگاری است. اما حداقل می توانید حتی با سخت افزار قدیمی بازی کنید.

بسیاری از بازی های جدید نیاز به نصب آخرین نسخه DirectX دارند، حتی اگر کارت گرافیک از نسل قبلی باشد. یعنی یک بازی جدید که از مسیر DirectX 8 استفاده می کند همچنان نیازمند نصب آخرین نسخه DirectX 9 برای کارت گرافیک کلاس DirectX 8 است.

تفاوت بین نسخه های مختلف Direct3D API در DirectX چیست؟ نسخه های اولیه DirectX - 3، 5، 6 و 7 - از نظر قابلیت های Direct3D API نسبتا ساده بودند. توسعه دهندگان می توانند جلوه های بصری را از لیست انتخاب کرده و سپس نحوه عملکرد آنها را در بازی آزمایش کنند. گام مهم بعدی در برنامه نویسی گرافیک DirectX 8 بود. این امکان را برای برنامه ریزی کارت گرافیک با استفاده از سایه بان ها معرفی کرد، بنابراین توسعه دهندگان برای اولین بار آزادی برنامه ریزی افکت ها را به روشی که نیاز داشتند داشتند. DirectX 8 از نسخه های Pixel Shader 1.0 تا 1.3 و Vertex Shader 1.0 پشتیبانی می کند. DirectX 8.1، نسخه به روز شده DirectX 8، Pixel Shader 1.4 و Vertex Shader 1.1 را دریافت کرد.

در DirectX 9، می توانید حتی برنامه های سایه زن پیچیده تری ایجاد کنید. DirectX 9 از Pixel Shader 2.0 و Vertex Shader 2.0 پشتیبانی می کند. DirectX 9c، نسخه به روز شده DirectX 9، دارای مشخصات Pixel Shader 3.0 است.

DirectX 10، نسخه آتی API، نسخه جدید ویندوز ویستا را همراهی خواهد کرد. نمی توانید DirectX 10 را روی ویندوز XP نصب کنید.

نور HDR و OpenEXR HDR

HDR مخفف عبارت High Dynamic Range است. یک بازی با نور HDR می تواند تصویر واقعی تری نسبت به بازی بدون آن ایجاد کند و همه کارت های ویدیویی از نور HDR پشتیبانی نمی کنند.

قبل از ظهور کارت‌های گرافیک DirectX 9، پردازنده‌های گرافیکی به دلیل دقت محاسبات نوری آن‌ها به شدت محدود بودند. تا به حال، روشنایی فقط با 256 (8 بیت) سطح داخلی قابل محاسبه بود.

هنگامی که کارت‌های ویدئویی DirectX 9 ظاهر شدند، قادر به تولید نور بودند دقت بالا- 24 بیت کامل یا 16.7 میلیون سطح.

با 16.7 میلیون سطح و گام بعدی در عملکرد کارت های ویدئویی DirectX 9/Shader Model 2.0، نور HDR بر روی رایانه ها امکان پذیر شد. این یک فناوری نسبتاً پیچیده است و شما باید آن را به صورت پویا تماشا کنید. اگر صحبت کنیم به زبان سادهسپس نور HDR کنتراست را افزایش می دهد (سایه های تیره تیره تر، سایه های روشن روشن تر به نظر می رسند)، در حالی که میزان جزئیات روشنایی را در مناطق تاریک و روشن افزایش می دهد. بازی با نور HDR پر جنب و جوش تر و واقعی تر از بدون آن به نظر می رسد.

پردازنده‌های گرافیکی سازگار با آخرین مشخصات Pixel Shader 3.0 محاسبات نورپردازی با دقت 32 بیتی و ترکیب نقطه شناور را امکان‌پذیر می‌کنند. بنابراین، کارت‌های ویدئویی کلاس SM 3.0 می‌توانند از روش نورپردازی OpenEXR HDR ویژه ای که برای صنعت فیلم طراحی شده است، پشتیبانی کنند.

برخی از بازی‌هایی که فقط از نورپردازی OpenEXR HDR پشتیبانی می‌کنند، با نور HDR روی کارت‌های گرافیک Shader Model 2.0 اجرا نمی‌شوند. با این حال، بازی‌هایی که به روش OpenEXR متکی نیستند، بر روی هر کارت گرافیک DirectX 9 اجرا می‌شوند، برای مثال، Oblivion از روش OpenEXR HDR استفاده می‌کند و تنها اجازه می‌دهد تا نور HDR را بر روی آخرین کارت‌های گرافیکی که از مشخصات Shader Model 3.0 پشتیبانی می‌کنند. به عنوان مثال، nVidia GeForce 6800 یا ATi Radeon X1800. بازی‌هایی که از موتور سه بعدی Half-Life 2 استفاده می‌کنند، از جمله Counter-Strike: Source و Half-Life 2: Aftermath آینده، امکان رندر HDR را در کارت‌های گرافیک DirectX 9 قدیمی‌تر که فقط Pixel Shader 2.0 را پشتیبانی می‌کنند، فعال می‌کنند. به عنوان مثال می توان به خط GeForce 5 یا ATi Radeon 9500 اشاره کرد.

در نهایت، به خاطر داشته باشید که همه اشکال رندر HDR نیاز به قدرت پردازشی جدی دارند و می‌توانند حتی قدرتمندترین پردازنده‌های گرافیکی را به زانو درآورند. اگر می خواهید جدیدترین بازی ها را با نور HDR انجام دهید، گرافیک با کارایی بالا ضروری است.

ضد آلیاسینگ تمام صفحه

ضد aliasing تمام صفحه (به اختصار AA) به شما امکان می دهد "نردبان" مشخصه را در مرزهای چند ضلعی حذف کنید. اما باید در نظر داشت که ضدآلیاسینگ تمام صفحه منابع محاسباتی زیادی را مصرف می کند که منجر به کاهش نرخ فریم می شود.

Anti-aliasing بسیار به عملکرد حافظه ویدیویی بستگی دارد، بنابراین یک کارت گرافیک پرسرعت با حافظه سریع می تواند آنتی آلیاسینگ تمام صفحه را با تأثیر کمتری بر عملکرد نسبت به یک کارت گرافیک ارزان قیمت محاسبه کند. Antialiasing را می توان در حالت های مختلف فعال کرد. به عنوان مثال، 4x antialiasing تصویر بهتری نسبت به 2x antialiasing ایجاد می‌کند، اما ضربه بزرگی به عملکرد خواهد بود. در حالی که 2x antialiasing وضوح افقی و عمودی را دو برابر می کند، حالت 4x آن را چهار برابر می کند.

فیلتر بافت

تکسچرها بر روی تمام اشیاء سه بعدی بازی اعمال می شوند و هر چه زاویه سطح نمایش داده شده بیشتر باشد، اعوجاج بافت بیشتر به نظر می رسد. برای حذف این اثر، پردازنده‌های گرافیکی از فیلتر بافت استفاده می‌کنند.

اولین روش فیلتر دو خطی نام داشت و نوارهای مشخصه ای تولید کرد که چندان برای چشم خوشایند نبود. وضعیت با معرفی فیلتر سه خطی بهبود یافت. هر دو گزینه روی کارت‌های ویدئویی مدرن بدون جریمه عملکرد کار می‌کنند.

امروزه بهترین راه برای فیلتر کردن بافت ها، فیلتر ناهمسانگرد (AF) است. فیلتر ناهمسانگرد مانند آنتی آلیازینگ تمام صفحه، می تواند در سطوح مختلف فعال شود. به عنوان مثال، 8x AF کیفیت فیلتر بهتری نسبت به AF ​​4x می دهد. فیلتر ناهمسانگرد مانند آنتی آلیازینگ تمام صفحه به مقدار مشخصی از قدرت پردازش نیاز دارد که با افزایش سطح AF افزایش می یابد.

بافت با وضوح بالا

همه بازی‌های سه بعدی با در نظر گرفتن مشخصات خاصی ساخته می‌شوند و یکی از این الزامات حافظه بافتی را که بازی به آن نیاز خواهد داشت، تعیین می‌کند. تمام بافت های لازم باید در حین بازی در حافظه کارت گرافیک قرار بگیرند، در غیر این صورت عملکرد به طور قابل توجهی کاهش می یابد، زیرا دسترسی به بافت به RAM باعث تاخیر قابل توجهی می شود، البته فایل صفحه بندی روی هارد دیسک نیز ذکر نشده است. بنابراین، اگر یک توسعه‌دهنده بازی روی 128 مگابایت حافظه ویدئویی به عنوان حداقل نیاز حساب می‌کند، مجموعه بافت‌های فعال نباید در هر زمانی از 128 مگابایت تجاوز کند.

بازی‌های مدرن دارای چندین مجموعه بافت هستند، بنابراین بازی روی کارت‌های ویدیویی قدیمی‌تر با حافظه ویدیویی کمتر و همچنین روی کارت‌های جدید با حافظه ویدیویی بیشتر بدون مشکل اجرا می‌شود. به عنوان مثال، یک بازی ممکن است شامل سه مجموعه بافت باشد: برای 128 مگابایت، 256 مگابایت و 512 مگابایت. امروزه بازی های کمی هستند که از 512 مگابایت حافظه ویدئویی پشتیبانی می کنند، اما همچنان عینی ترین دلیل برای خرید کارت گرافیک با این حجم حافظه هستند. در حالی که افزایش حافظه تأثیر کمی بر عملکرد دارد، اما اگر بازی از مجموعه بافت های مناسب پشتیبانی کند، از کیفیت بصری بهبود یافته بهره مند خواهید شد.

آنچه باید در مورد کارت گرافیک بدانید؟

بازگشت

×
به انجمن "page-electric.ru" بپیوندید!
VKontakte:
من قبلاً در انجمن "page-electric.ru" مشترک هستم