В архитектуре GeForce 8800 предусмотрен щадящий режим работы и механизм "скрытия" латентности текстурной выборки с помощью одновременного исполнения ряда независимых математических операций. Если в пиксельном конвейере GeForce 7 обсчёт адреса текстуры перемежается с математическими FP шейдерными операциями, в модуле Shader Unit 1, то несвязанная независимая работа в шейдерными и текстурными операциями в GeForce 8800 снимает эту проблему.
Ещё один немаловажный аспект, от которого напрямую зависит общая производительность графической системы, особенно при обработке комплексных DX10 шейдеров – эффективность процесса ветвления. В отличие от чипов серии GeForce 7, "заточенных" на обработку типичных DirectX 9 шейдеров, артитектура GeForce 8800 разработана для обработки комплексных DX10 шейдеров, при этом производится ветвление 16 пикселей (тредов), в некоторых случаях – до 32 пикселей.
Что касается функционирования Z-буфера, в чипах GeForce 8800 GTX сортировка пикселей производится со скоростью, в четыре раза превосходящей этот процесс у GeForce 7900 GTX, поэтому GPU имеет возможность обрабатывать все сложные ситуации на уровне каждого пикселя. Z-сравнения данных о каждом пикселе производятся в модуле растеризатора - ROP (raster operations). Для увеличения производительности чипы GeForce 8800 поддерживают технологию Early-Z, позволяющую определить Z-значения пикселей до того как они поступают на конвейер пиксельного шейдера, благодаря этому увеличивается производительность и не производится ряд заведомо ненужных операций. Пример работы Early-Z показан на рисунках ниже.