Portfolio
My Blog
Scroll down to discover
Search
Categories

Tổng quan 3D graphic pipeline – VGA

February 19, 2011Category : IT & Network

3D graphic pipeline :
Bởi vì tính chất làm việc lập đi lập lại của đồ họa 3D và cũng vì khối lượng tính tóan ,khối lượng thông tin nhiều , nên toàn bộ quá trình xử lý đồ họa được chia nhỏ thành những bước .Những bước nay họat động 1 cách trình tự và được gọi là 3D graphic pipeline . Một ví dụ về pipeline là việc giặt đồ ,công việc giặt đồ gồm 3 bước : giặt ,sấy và phơi đồ ,nếu họat động theo kiểu pipeline thì lượt đồ thứ 1 sau khi giặt sẽ được chuyển sang giai đọan sấy thì lượt đồ thứ 2 sẽ được chuyển qua giai đọan giặt . Khi lượt đồ thứ 1 được đem phơi thì lượt thứ 2 được sấy ,lượt đồ thứ 3 được bỏ vào giặt . Trên thực tế GPU sẽ họat động theo những trình tự như vậy . Đây là ý nghĩa của 3 D graphic pipeline . Ở đây cần phân biệt với số pipeline mà các nhà sản xuất thường đưa ra để quảng cáo , đây là số lượng pixel pipeline ( số lượng pixel shader ) hoặc ROPs ( tùy website ) ,ở đây có sử dụng từ pipeline vì các units này hoạt động 1 cách song song ,ví dụ như vid có 16 pixel pipeline thì 16 cái này cùng làm việc trong 1 lúc chứ không phải là cái này làm xong mới đến cái kia làm ,tương tự đối với ROPs

Đây là các giai đọan của 3D graphic pipeline :
3D Pipeline _Tổng quát về các giai đoạn của nó
1. Application/Scene
• Scene/Geometry database traversal
• Movement of objects, and aiming and movement of view camera
• Animated movement of object models
• Description of the contents of the 3D world
• Object Visibility Check including possible Occlusion Culling
• Select Level of Detail (LOD)
2. Geometry
• Transforms (rotation, translation, scaling)
• Transform from Model Space to World Space (Direct3D)
• Transform from World Space to View Space
• View Projection
• Trivial Accept/Reject Culling
• Back-Face Culling (can also be done later in Screen Space)
Lighting
• Perspective Divide – Transform to Clip Space
• Clipping
• Transform to Screen Space
3. Triangle Setup
• Back-face Culling (or can be done in view space before lighting)
• Slope/Delta Calculations
• Scan-Line Conversion
4. Rendering / Rasterization
• Shading
• Texturing
• Fog
• Alpha Translucency Tests
• Depth Buffering
• Antialiasing (optional)
• Display
API :
Trước khi đi vào các bước này tôi xin giải thích sơ về API .API viết tắt của từ Application Programming Interface hiện tại bao gồm : SGI's OpenGL, Microsoft's Direct3D, và Pixar's Renderman. API giống như 1 cổng giao tiếp giữa phần cứng và phần mêm ,các nhà viết phần mêm sẽ víêt những việc mà vid cần làm để API dịch lại cho driver của vid hiểu những việc cần làm .Ngược lại các nhà sản xuất cũng viết driver để API hiểu .

Không gian 3D :

Model space : Model ở đây là các hình người ,nhà cửa ,đồ vật …. .( ta sẽ nhắc lại ở phần sau của bài ) .Mỗi model sẽ có 1 hệ thông tọa độ riêng của nó . Trên mỗi model cũng có 1 điểm “ điều khiển “ ( control point hay handle ) ,để di chuyển model này thì các nhà thiết kế chỉ cần di chuyển điểm này và cũng nhờ điểm này có thể giúp việc rotate model lại .

World space : Khi các model được đem ra từ các engine ( hệ thống các model ) và đưa vào world space ,ở đây hệ thống tọa độ của model sẽ được đổi thành 1 hệ thống chung ( do các model có hệ thống tọa độ khác nhau )

View space :
Trong không gian này góc nhìn sẽ được đem vào, góc nhìn này sẽ được phần mềm quy định .Nhìn trong hình, góc nhìn sẽ được diễn tả dưới hình tháp bị cắt cụt ,những model ở gần sẽ được sắp xếp về phía near clipping plane, những model nằm xa sẽ được sắp xếp gần với far clipping plane trong 1 frame .Những vật nằm ngoai hình này sẽ không được vẽ lên trên frame .

 

Scene space :
Đây cũng chính là không gian trong monitor của ta ,những model sau khi đã được sắp xếp trong view space sẽ được chuyển sang scene space ,đồng nghĩa với việc chuyển các tọa độ 3D của hình model sang tọa độ 2D ( x,y ) .Các giá trị z không phải được bỏ đi mà sẽ được nhớ để ứng dụng vào việc cắt đi những hình bị chồng lên nhau ,cắt đi những texture ở mặt sau của hình .

Bây giờ ta đi sâu vào phân tích 3D từng bước của 3d Graphic pipeline :

Bước 1 : application/scene :
Trong quá trình này bao gồm các nhiệm vụ :

Scene/Geometry database traversal
Movement of objects, and aiming and movement of view camera
Animated movement of object models
Description of the contents of the 3D world
Object Visibility Check including possible Occlusion Culling
Select Level of Detail (LOD)

Hầu hết các game hiện tại khi tạo ra không thể vẽ lại tất cả các hình người ,nhà cửa ,súng ….. nói chung tất cả những vật thể trong game ( những cái này gọi là model như đã nói trên ) mà thường lấy những model có sẵn của 1 số hãng chuyên tạo model ( engine ), ví dụ hiện tại có các engine như Doom ,unreal ,Valve, Crytek … .Nói thêm rằng những model này được tạo bởi các hình cơ bản ( geometric primitive ) đó thường là những hình tam giác ,các hình tam giác này hợp lại với nhau để tạo nên hình người ,cây cối ,căn nhà …., ngoài việc cung cấp những model ,engine còn cung cấp cả AI ,physic ( quần áo của nhân vật ,nước ,khói ,vụ nổ … ), audio ,network Những model này khi được sử dụng trong các game thì sẽ được sửa lại chút ít tùy theo nhu cầu của game .

 

Trong quá trình (Geometry database traversal , Movement of objects, and aiming and movement of view camera, Description of the contents of the 3D world) thì phần mềm sẽ search trong engine những model nào cần dùng trong frame của mình , sau đó đem vào để cho gpu xử lý ( render ) ,việc đem các hình từ frame này sang frame khác sẽ tạo nên sự chuyển động của hình ảnh, ngòai ra chính phần mềm cũng đem vào game góc nhìn của 1 cảnh của game .

Ngoài ra ở bước đầu này ,phần mềm cũng đã có quá trình lọai bỏ những vật không thể thấy (Object Visibility Check including possible Occlusion Culling ) ,trong quá trình này phần mêm sẽ check xem những vật nào bị che phủ bởi những vật khác ,nếu bị che hòan toàn thì loại hoàn toàn nó ra ,nếu che 1 phần thì bỏ 1 phần . Ngòai việc check vật trước vật sau ,phần mềm còn check trên từng model xem model đó có lọt vào trong cái hình tháp bị cắt cụt ( view space ) hay không ? Nếu vật không lọt vào nó sẽ bị loại ra ,nếu lọt vào 1 phần ,những phần nằm ngoài sẽ bị lọai bỏ .Việc tính tóan sự hỉên thị này sẽ giúp giảm 1 công vịêc vẽ 1 cái vô ích của GPU.

Không chỉ dừng ở đó các nhà lập trình còn sử dụng các thủ thuật để giảm tải cho GPU ,khi check xem model có nằm được trong view space hay không ,thay vì dùng model đó check thì người ta sử dụng 1 hình hộp để xem sự hiển thị của model . Vi dụ : 1 model gồm 10 000 tam giác ,thì người ta dùng 1 hình hộp gồm 12 tam giác để thay thế ( mỗi mặt gồm 2 tam giác ) để đại diện ,nếu hình hộp đó có thể hiện thị được thì model đó sẽ được vẽ ngay trong hình hộp .Nhờ đó nếu hình hộp đó không hiển thị được trên frame đó thì nó giảm được việc phải render cho 10 000 tam giác đó .

Các model thường được build ở những mức detail khá nhau ( để phù hợp với setting của game như low ,medium ,high detail ) ví dụ 1 model cái máy bay có thể được build ở 10.000 tam giác ,5.000 tam giác ,3000 tam giác ….tùy người chơi chọn setting mà đưa model vào .Nhờ vào tính chất này mà khi đưa vào GPU các model ,các nhà lập trình lại thực hiện 1 thủ thuật tinh giảm khối lượng công việc của GPU ,khi những model ở vị trí xa ( gần far clipping plane ) thì họ sẽ làm giảm số lượng tam giác của model lại ,sự giảm này không ảnh hưởng tới người chơi vì những vật ở quá xa rất khó cho người chơi nhận ra được.

Mỗi model càng nhiều tam giác thì càng trông giống thật ,mỗi đỉnh của tam giác ( vertice ) bao gồm nhiều thông in về nó ( tọa độ ,màu sắc .. ) Một số model để trông giống thật đòi hỏi phải tốn rất nhiều tam giác nhất là những vật có hình cong ,sự giảm detail của các vật cong này có thể tạo nên hiệu ứng ( bumpy ) ( không biết nên dịch thế nào cho thóang nên xin phép để nguyên nó ) .Do đó để tinh giảm số lượng việc phải làm của GPU các nhà lập trình phải thực hiện công việc giảm các vertice nhưng không làm giảm chất lượng của model ,bằng cách ghép các tam giác tạo nên những dải ( strip ) hay hình quạt ( fan ) .
Dưới đây là ví dụ :

Nhìn trên hình bạn sẽ thấy nếu ghép 2 hình tam giác lại thì số lượng đỉnh của model sẽ giảm đi 2 đỉnh ,nghĩa là sẽ giảm thông tin về 2 đinh đó ( tọa độ ,màu sắc … ) ,tương tự với hình quạt kia . Sau việc tinh giảm đó ,model được đưa vào cho GPU xử lý .

Tóm lại những gì bạn nên nhớ ở bước 1 của 3D graphic pipeline này là :
+ Những model của game đều trong các engine
+ Quá trình này được CPU xử lý ,đưa thông tin vào GPU ,tính toán AI ,physic ,audio ,network …..
+ Trứơc khi các hình ảnh được đưa vào cho GPU xử lý thì đã được quá 1 quá trình optimize do các nhà lập trình thực hiện ,do đó game mới có bản pre beta ,beta ….. ( một trong những ví dụ về việc tranh cãi “ G80 yếu ớt trên nền game dx 10 “ trong forum amtech đã chứng minh việc này )


Bước 2 : Geometry

Trong quá trình này bao gồm các nhiệm vụ :
• Transforms (rotation, translation, scaling)
• Transform from Model Space to World Space (Direct3D)
• Transform from World Space to View Space
• View Projection
• Trivial Accept/Reject Culling (or can be done later in Screen Space)
• Back-Face Culling (can also be done later in Screen Space)
Lighting
• Perspective Divide – Transform to Clip Space
• Clipping
• Transform to Screen Space
Ở 3D world vật thể or model có thể được dịch chuyển hoặc biến đổi nhờ vào 4 phép biến đổi chính ( transform ) .Phép biến đổi thực hiện trên vật thể nhưng thực chất nó biến đổi các vertices của các vật thể bằng các phép toán phức tạp. Chính các phép biến đổi này sẽ làm cho các model trong các game khác nhau đôi chút .
Translation : phép biến đổi này cho phép di chuyển vật theo 3 trục của toạ độ
Rotation : phép biến đổi giúp vật xoay theo 1 trục tuỳ ý
Scaling : phép biến đổi giúp vật thay đổi kích thước của vật ( làm cho vật to hơn hoặc nhỏ đi )
Skewing : thay đổi hình dạng của vật thể

Trong giai đoạn geometry này cũng có sự di chuyển model từ Model space vào World space rồi từ World space vào View space ( tất nhiên những không gian này là không gian ảo ,chỉ là không gian mà card đồ hoạ dựng nên để tính toán ) .Khi di chuyển vào các không gian này thì toạ độ của vật sẽ theo không gian đó và cũng tuỳ thuộc vào phép biến đổi phía trên sử dụng .
• Trivial Accept/Reject Culling (or can be done later in Screen Space)
• Back-Face Culling (can also be done later in Screen Space)
Lighting
• Perspective Divide – Transform to Clip Space
• Clipping
• Transform to Screen Space
Ở giai đoạn Geometry này cũng có 1 số kĩ thuật làm giảm việc tính toán cho các giai đoạn sau đó là Trivial Accept hay Reject Culling và Back Face Culling
Reject Culling/Trivial Accept :kĩ thuật này cũng giống như kĩ thuật đã nhắc tới ở giai đoạn trên ,nó xem xét vật có nằm trong view space hay không ,sau đó tìm những phần thừa ra ngoài view space để cắt đi . Kĩ thuật này thực hiện khá đơn giản ,nó xác định những vật cần phải cắt bằng cách định xem toạ độ ( x,y,z ) của vertices có nằm trong view space hay ko ? nếu không nằm trong thì sẽ bỏ đi toàn bộ tam giác này . Việc cắt như kiểu này sẽ thừa lại những tam giác có 1 hoặc 2 đỉnh nằm trong view space nhưng 1,2 đỉnh còn lại nằm ngoài .
Back Face Culling : Kĩ thuật này cho phép bỏ đi những tam giác nằm ở mặt sau của model ,tính trung bình ra thì có ½ số tam giác bị loại bỏ do nằm ở mặt sau của model tại 1 thời điểm nhất định .Tuy nhiên chỉ 1 vài trường hợp những tam giác ở mặt sau model không bị bỏ đi đó là trường hợp model có tính chất trong suốt .

Lighting :

Không ít người đã từng nghe từ “ Transform and lighting” 2 từ này ít khi đi riêng rẽ 1 mình nhưng không có nghĩa là sau qúa trình transform như nói ở trên thì sẽ đến giai đoạn tính toán ánh sáng ,mà giai đoạn này thường xảy ra ngay sau khi vật đã được chuyển vào view space .Hiệu ứng ánh sáng trên vật thể được thực hiện bằng các đặt các model về ánh sáng và sự phản chiếu vào các vật thể .

Clipping :

Ở giai đoạn clipping này vật cũng sẽ được cắt như giai đoạn Culling trên nhưng quá trình thực hiện phức tạp hơn ,ở giai đoạn trên khi định ra 3 toạ độ (x,y,z ) của vertices nằm ngoài view space thì nó sẽ bỏ hoàn toàn còn với Clipping thì nó không bỏ hoàn toàn tam giác mà cắt những phần thừa của tam giác nằm ngoài view space mà thôi.

Tóm tắt lại :
+ Trong giai đoạn Geometry này bộ xử lý vertex shader ( vertex shader processor ) sẽ thực hiện nhiệm vụ biến đổi ( transform ) và tính toán ánh sáng cho hình ảnh ( lighting )

Bước 3 : Triangle setup

Trong quá trình này gồm các nhiệm vụ :

Back-face Culling (or can be done in view space before lighting)
Slope/Delta Calculations
Scan-Line Conversion

Nếu Back face culling đã được thực hiện ở giai đoạn trên thì gian đoạn này không còn thực hiện nữa .

Slope/Delta calculations : Cứ 2 điểm của 1 tam giác ( tam giác thành phần model ) ta sẽ có 1 cạnh hay 1 đừơng thẳng ,đường thẳng đó sẽ có dạng y= mx + b ,chính m là giá trị delta hay slope .

Sau đó nhờ vào giá trị slope, thuật toán digital differential analyzer (DDA) sẽ chuyển các cạnh của tam giác ( tam giác thành phần của model ) sang giá trị x,y của pixel.

Kết quả của quá trình này là thông tin về vị trị của model sẽ được chuyển thành các thông tin vị trí của pixel ( trên monitor ) ,thông tin về màu sắc của pixel vẫn chưa có và sẽ được thực hiện nhờ vào giai đoạn rendering phía sau sẽ trình bày . Trong quá trình chuyển đổi thông tin này , chỉ có thông tin của 2 vertices ( đỉnh ) là được chuyển trực tiếp thành thông tin của pixels, còn những điểm còn lại trên cạnh ( tạo bởi 2 vertices ) thì được DDA suy ra , từ việc này sẽ dẫn đến hình ảnh bị hiện tượng “ răng cưa “ .

Tóm lai :

+ Quá trình này để tìm các chuyển các vị trí của model từ view space sang scene space ( không gian monitor )
+ Do cách tính toán của quá trình này mà hình ảnh có thể bị hiện tượng “ răng cưa “

Bước 4: Rendering / Rasterization

Trong quá trình này gồm các nhiệm vụ :
Shading
Fog
Alpha Translucency Tests
Shadowing
Antialiasing
Depth buffering
Display

Shading :Quá trình này được thực hiện bởi nhiều thuật toán : Flat shading ,Gouraund shading ,Phong shading .Những thuật toán này được sử dụng các giá trị về ánh sáng trên các vertices của tam giác sau đó nội suy ra độ bóng trên bề mặt của tam giác ,từ đó dẫn đén các model sẽ có độ bóng . Ngoài ra ở giai đoạn này các texture ( đáng lẽ phải gọi là texture map : bản đồ texture ) được dán vào những vật thể/model ,texture là những hình 2D có thể là bức tường ,mặt đất …… ( Xem hình ).Trong những game/ứng dụng hiện tại mỗi một vật không chỉ là 1 lớp texture được dán vào mà là nhiều lớp ( multitexture ),các lớp có thể là gồm base texture , bump map ,light vector …. kết hợp lại .

Fog : Kĩ thuật này tính toán để cho nền của cảnh vật như bị che phủ bởi 1 màn sương và che đậy đi những chỗ ko có texture hay nói cách khác nó che lên những chỗ texture chưa xuất hiện.Tuy nhiên các bạn đừng lầm lẫn ở đây fog không che lên những texture hoặc object đã xuất hiện ,ví dụ như căn nhà đã xuất hiện trên frame thì ko bao giờ còn có fog trên căn nhà đó ,sự mờ nhạt của những texture trên căn nhà nguyên nhân là do bộ lọc vật liệu ( texture filtering ) ( vì Rock thấy nhiều post các bạn hay ghi ,đại loại như là hình ảnh bị fog …. ) ,nhấn mạnh lại 1 lần nữa fog chỉ xuất hiện ở những vùng không có texture ,không có model hay vật thể .

Alpha transluscency tests : Đây là một kĩ thuật nhằm tạo nên những vật có tính chất trong suốt và được ứng dụng để render vụ nổ ,khói ,nước ,những tấm kính …..
Tóm tắt lại :
+ Giai đoạn này (Shading ,Fog và Alpha blending)là giai đoạn cho model những hiệu ứng đổ bóng ,dán những texture lên model ,cho model có được hiệu ứng trong suốt …..
+ Giai đoạn này được thực hiện bởi bộ xử lý pixel shader
Sau những giai đoạn Shading ,Fog và Alpha blending những model hay vật thể đã gần như hoàn chỉnh trên view space ,tuy nhiên để cho hình được xuất hiện trên monitor những texture trên model bây giờ cần phải được biến thành những điểm trên monitor ( pixel ) .Nhớ lại trong quá trình scan_line convertion thì trên monitor chỉ có bộ khung của model/vật thể chứ vẫn chưa có màu sắc ,màu sắc trên bộ khung này sẽ được định ra bằng cách dán các texture trên model/vật thể vào ,bộ khung đó ( thực chất là dán các phần tử nhỏ nhất/texels của texture vào ) Việc dán này được thực hiện nhờ bộ lọc texture filtering ( bộ lọc vật liệu )

 

 

Texture filtering :

Bộ lọc vật liệu này có nhiều loại :
Point sampling
Bilinear filtering
Trilinear MIP-mapping
Anisotropic filtering
Anisotropic filtering

Công nghệ 3D ngày nay phát triển một cách chóng mặt. Bên cạnh những công nghệ mới như "đổ bóng lập trình được", "ánh sáng động"…, ngay cả những kỹ thuật tưởng chừng như cơ bản là "dát" lớp vật liệu cũng không ngừng cải tiến. Bài viết này giới thiệu các kỹ thuật lọc vật liệu phổ biến hiện nay và cả các bí mật tối ưu được các nhà sản xuất sử dụng để tăng tốc các phép lọc đó.

Công nghệ 3D ngày nay phát triển một cách chóng mặt. Bên cạnh những công nghệ mới như "đổ bóng lập trình được", "ánh sáng động"…, ngay cả những kỹ thuật tưởng chừng như cơ bản là "dát" lớp vật liệu (texture – hay còn gọi là vân bề mặt) cũng không ngừng cải tiến. Bài viết này giới thiệu các kỹ thuật lọc vật liệu (texture filtering) phổ biến hiện nay và cả các bí mật tối ưu được các nhà sản xuất sử dụng để tăng tốc các phép lọc đó.

CÁC PHƯƠNG PHÁP LỌC

Trước hết, chúng ta làm quen với một số khái niệm liên quan đến texture – nguồn của phép lọc:

• Texture (vật liệu/vân bề mặt): là hình ảnh dùng để "lát" hay "dán" lên một bề mặt. Ví dụ: nền nhà bằng gỗ hay đá đều là các mặt phẳng như nhau, nhưng khác nhau bởi chất liệu "dát" lên.

• Texel: một điểm ảnh (pixel) trên texture. Ta biết rằng texture chỉ là hình ảnh gốc. Còn hình ảnh kết quả trên màn hình được tạo ra từ việc lấy mẫu (sampling) trên texture. Điểm ảnh trên màn hình (hay frame buffer) được gọi là pixel, còn điểm ảnh được lấy mẫu trên texture gọi là texel (gọi tắt của texture pixel).

• Texture filtering (lọc vật liệu): ám chỉ việc lấy mẫu (sample) các texel và thực hiện các phép toán trên các mẫu được lấy (thường là các phép tính trung bình có trọng số) để cho ra điểm ảnh kết quả. Texture filtering chỉ dùng để "đặt" hay "dán" (map) texture một cách hiệu quả nhất (về hiệu năng, về chất lượng…) lên bề mặt trong không gian ba chiều. Nó không bao gồm các thao tác làm thay đổi nội dung điểm ảnh như chiếu sáng, tạo bóng tối…

1. Lấy mẫu thô

Phương pháp lấy mẫu đơn giản nhất là ứng với mỗi điểm cần vẽ, ta tìm một điểm phù hợp nhất trên texture. Đây là phương pháp không dùng bộ lọc, được biết đến với cái tên nearest neighbour (láng giềng gần nhất) hay nearest-point sampling (lấy mẫu điểm gần nhất). Phương pháp này thể hiện rất nhiều nhược điểm nhưng cho tốc độ rất cao. Điển hình có thể kể ra đây hai nhược điểm:

• Khi hình ảnh đích lớn hơn hình ảnh nguồn (chẳng hạn khi ta đứng sát một bờ tường): ta có cảm tưởng như các texel được phóng to ra và hình ảnh như là được ghép bởi các khối vuông thô thiển. Lí do là một texel được lấy mẫu cho nhiều pixel.

• Khi hình ảnh đích nhỏ hơn hình ảnh nguồn (chẳng hạn khi ta tiến ra rất xa khỏi bờ tường): chắc chắn thông tin sẽ bị mất mát do số pixel đích ít hơn số texel, dẫn đến có texel không được lấy mẫu.

2. Mipmap

Mipmap là các biến thể theo các kích thước khác nhau của cùng 1 texture.

Tại sao phải dùng đến các mipmap? Giả sử bạn đang đứng trên nền nhà bằng gạch, chắc chắn những viên gạch ở gần bạn trông sẽ "to" hơn theo phối cảnh, và do đó chi tiết hơn. Ở xa, sẽ có ít điểm hơn để hiển thị texture. Do đó mà texture bị co lại. Phép co sẽ làm mất những chi tiết quan trọng như đường viền xi măng của các viên gạch. Lí do là chỉ một số ít điểm trên texture được lấy mẫu (tùy vào loại bộ lọc bạn sử dụng mà độ mất mát khác nhau, tùy vào số texel được lấy mẫu cho một pixel). Tệ hơn nữa, khi bạn di chuyển trên nền gạch, các điểm lấy mẫu trên texture thay đổi theo. Điều này gây ra cảm giác nhiễu trên màn hình vì các điểm ảnh thay đổi liên tục từ texel này sang texel khác. Đặc biệt khi nền gạch có nhiều hoa văn với độ tương phản cao. Nhiễu còn thể hiện ở điểm các hoa văn trông như rời rạc, không liên tục do các texel được lấy mẫu một cách rời rạc.

Các mipmap liên tiếp nhau có kích thước mỗi chiều chênh nhau 2 lần (như vậy ở texture nhỏ hơn, 1 điểm được tạo ra từ 4 điểm ở texture lớn hơn). Các card đồ hoạ ngày nay đều cho phép sinh mipmap tự động. Tức là chỉ cần cung cấp texture ở mức chi tiết nhất.

Để kiểm tra việc sử dụng các mipmap, người ta dùng các Color Mipmap. Người ta tô các texture ở các mức khác nhau với các màu khác nhau. Do đó, khi hiển thị lên màn hình, ta có thể dễ dàng nhận thấy các texture khác nhau được lấy mẫu như thế nào.

3. Linear Filtering (lọc tuyến tính)

Lọc tuyến tính hiểu một cách nôm na là thay vì ta chuyển trực tiếp từ texel này sang texel khác khi lấy mẫu, các texel lại được chuyển qua dần dần một cách tuyến tính. Trong phép lọc tuyến tính, với mỗi chiều lọc, mỗi điểm ảnh được tạo ra từ trung bình có trọng số của hai texel.

Phép lọc tuyến tính đơn giản nhất là Bilinear Filtering. Phép lọc này tạo ra pixel kết quả từ 4 texel gần nhau. Gọi là Bilinear (song tuyến tính) vì nó tuyến tính theo hai trục của texture.

Hình sau đây cho thấy tác dụng của lọc tuyến tính khi thu nhỏ một trang web so với việc dùng phương pháp nearest-point sampling. Do có nhiều texel được lấy mẫu hơn nên nội dung mất mát giảm đi.

Đối với việc phóng to một hình, lọc tuyến tính làm cho việc chuyển tiếp giữa các texel trở nên mượt mà, không bị cảm giác về các khối vuông.

Trong đồ hoạ 3D và game hiện nay, gần như ta không còn gặp nearest neighbour nữa mà thay vào đó là các phương pháp lọc tiên tiến, phổ biến nhất là lọc tuyến tính.

4. Trilinear Filtering (lọc tam tuyến tính)

Như ta thấy, Bilinear filtering không dính dáng tới các mipmap. Nói cách khác, bilinear lọc từng texture trong mipmap một cách riêng rẽ. Do đó, ở chỗ chuyển tiếp giữa các mức mipmap lộ ra mép nối. Kết quả là trông hình ảnh đích như được tạo bởi các "băng" hay "dải" mipmap song song. Điều này đặc biệt khó chịu khi bạn di chuyển trong game. Có cảm giác như có những lớp hình ảnh luôn luôn chạy ở phía trước mặt bạn. Những đường nằm ngang cứ như muốn chấn vào mắt bạn.

Các băng texture bị biến mất với trilinear, hình trở nên "mượt" hơn

Trilinear filtering giải quyết vấn đề này bằng cách thực hiện lọc tuyến tính trên cả các mipmap, làm cho các texture được hoà trộn vào nhau trên hình đích. Trong các card đồ hoạ hiện nay, "chi phí” cho bilinear filtering rất thấp, gần như "miễn phí” (theo nghĩa không ảnh hưởng đến hiệu năng). Nhưng trilinear thì không như vậy, nó là một bộ lọc tốn kém. Vì nó không chỉ tăng gấp đôi số điểm lấy mẫu (từ 4 lên 8) mà còn yêu cầu phải xử lí nhiều texture cùng lúc. Do đó, hiện nay xuất hiện nhiều phép tối ưu để thực hiện trilinear hiệu quả hơn.

5. Anisotropic filtering (lọc bất đẳng hướng)

Trong thực tế đồ hoạ 3D, texture không đơn thuần được vẽ với hình dáng như ban đầu của nó. Do phối cảnh ba chiều, hình vuông hay hình chữ nhật (là dạng gốc của texture) trở thành hình bình hành, hình thang… Trong bộ lọc bất đẳng hướng, khác với Linear Filtering, các texel không được lấy mẫu theo một hình dạng đối xứng (đẳng hướng) mà theo một hình bất quy tắc được điều chỉnh tùy theo phối cảnh. Ta có thể hình dung mỗi pixel đích trên hình ảnh kết quả là một hình vuông. Tương ứng với hình vuông này có thể là hình chữ nhật, hình bình hành hay hình thang… trên texture. Dưới đây là một hình minh hoạ khi ánh xạ cùng một hình tròn nhỏ trên hình ảnh đích sang texture. Tùy vị trí của hình tròn mà các vùng tương ứng trên texture khác nhau.

Anisotropic filtering tiến bộ hơn hẳn so với linear filtering vì nó bám sát hình dạng thực của điểm ảnh, cung cấp khả năng thể hiện thực và đầy đủ hơn nội dung của điểm ảnh, làm giảm thiểu mất mát nội dung trên hình kết quả. Anisotropic filtering có nhiều mức độ khác nhau (như ta thấy trong các thiết lập của driver và game), tùy thuộc vào số texel được lấy mẫu cho mỗi điểm ảnh đích. 1x lấy mẫu 4 texel (ta chưa xem xét đến mipmap), nên kết quả tương tự bilinear; 2x lấy mẫu 8 texel; 4x lấy 16; 8x lấy 32 và 16x (mức cao nhất hiện nay) lấy 64. Ta dễ dàng nhận thấy rằng càng lấy nhiều texel càng đòi hỏi texture chi tiết. Do đó, với các mức cao, mipmap càng bị đẩy sâu vào trong.

Lọc bất đẳng hướng có thể kết hợp với bilinear hoặc trilinear thành bilinear anisotropic hoặc trilinear anisotropic. Với bilinear anisotropic, lọc diễn ra độc lập trên từng mức mipmap; với trilinear anisotropic, lọc được hoà trộn trên hai mức mipmap gần nhất.

Tuy nhiên, cho đến hiện nay, lọc bất đẳng hướng vẫn là một "món" xa xỉ. Nó vừa yêu cầu lấy mẫu một số lượng lớn các điểm, lại vừa sử dụng phép tính có trọng số phức tạp. Do đó, nhiều phép tối ưu đã được thực hiện.

BÍ MẬT CỦA TỐI ƯU

1. Brilinear – Optimized Trilinear

Hiểu một cách đơn giản thì "tối ưu" nghĩa là "làm ít hơn chứ không phải tốt hơn". Nhà thiết kế cố gắng giảm các thao tác được yêu cầu để cho kết quả chính xác nhằm làm cho phần cứng chạy nhanh hơn mà ít ảnh hưởng đến cảm nhận của người sử dụng (nó có thể đem lại kết quả mà hầu hết các điểm ảnh đều bị sai khác, nhưng tác dụng về mặt thị giác giữa hai hình ảnh lại chênh lệch không đáng kể).

Phép tối ưu điển hình nhất và cũng được dùng phổ biến nhất là brilinear, một "phép lai" giữa trilinear với bilinear, thay thế cho trilinear. Mục đích chính của trilinear là làm mất đi các "dải" mipmap trên hình kết quả. Brilinear thu giảm vùng hòa trộn các mức mipmap vào sát các đường ranh giới và thực hiện bilinear hoàn toàn (tức chỉ dùng một mức mipmap) ở vùng chính giữa các "dải" này. Như vậy tức là giảm đáng kể việc sử dụng trilinear và thay thế bằng việc dùng bilinear. Ta có thể thấy rõ điều này qua hình minh hoạ dùng color mipmap dưới đây.

Với Brilinear, khoảng chuyển tiếp mipmap bị thu hẹp và có một khoảng chỉ được lọc Bilinear

Nói chung rất khó để phát hiện ra brilinear bằng mắt thường khi sử dụng các mipmap thực (chẳng hạn khi chơi game). Trong các game thông thường, brilinear có thể thu được đến hơn 30% hiệu năng so với full trilinear.

Hầu hết các chip đồ hoạ mới hiện nay đều dùng phương pháp này. Ta có thể thấy tùy chọn sử dụng "trilinear optimizations" trong driver của các card đồ họa mới dòng GeForce.

2. Tối ưu góc trong Anisotropic Filtering

Thử tưởng tượng bạn đang đứng đối diện với một bức tường. Vì bức tường song song với màn hình nên nó là một hình "đẳng hướng" (các hướng được bảo toàn tỉ lệ). Do đó, việc lọc bất đẳng hướng trên bức tường không khác biệt so với lọc tuyến tính. Cũng giống như vậy với các mặt phẳng khác. Mỗi mặt phẳng có một độ bất đẳng hướng (tỉ lệ chênh lệch giữa các hướng) cực đại nhất định tùy thuộc vào góc nhìn mặt phẳng đó. Do vậy chỉ cần một mức lọc bất đẳng hướng nhất định mà không cần thiết phải dùng mức lọc cao hơn. Ví dụ nếu texture bị biến dạng ở tỉ lệ 1:2, 2xAF là đủ (đương nhiên ngay cả trên một mặt phẳng, tỉ lệ biến dạng của texture cũng liên tục thay đổi, như đã được chỉ ra trong hình vẽ trước). Tối ưu góc trong Anisotropic Filtering tận dụng điều này để nâng cao hiệu năng xử lí. Nó áp dụng các mức độ lọc khác nhau cho các góc khác nhau. Nghĩa là ngay cả khi bạn yêu cầu mức lọc 16x, sẽ có những góc nào đó mà phép lọc chỉ diễn ra ở mức 2x. Thực tế rất ít góc được thực hiện ở mức 16x hoàn toàn. Tối ưu góc được áp dụng trong tất cả các card đồ hoạ của ATI dòng 9xxx và các dòng X, trong các card NVIDIA GeForce FX 5xxx, 6xxx, 7xxx.

3. Tối ưu theo mức mipmap

Tối ưu theo mức mipmap nói một cách ngắn gọn là tùy thuộc vào mức mipmap khác nhau mà áp dụng các mức lọc khác nhau (chẳng hạn các mức lọc bất đẳng hướng). Do ở các mức mipmap thấp, texture đã giảm chi tiết đi rất nhiều. Nên người xem thường không nhận thấy việc thay đổi độ phức tạp trong phép lọc.

4. Độ chính xác của các phép tính

Số bit được sử dụng để lưu trữ các giá trị, các tham số, trọng số trong các phép tính ảnh hướng rất lớn đến độ chính xác của kết quả.

Ví dụ dễ thấy nhất là số bit xác định trọng số trong phép lọc tuyến tính. Số bit này quyết định có bao nhiêu mức chuyển tiếp về màu sắc giữa hai mốc (hai màu của hai texel kề nhau). Vì hiện nay người ta chỉ dùng 8 bit cho mỗi thành phần màu, nên cũng chỉ cần tối đa 8 bit trọng số là có thể miêu tả đầy đủ các mức màu chuyển tiếp (256 mức). Đây là số bit được dùng trong các card GeForce. ATI sử dụng ít bit hơn. Với 6 bit, các card đồ hoạ của ATI chỉ có thể thể hiện được 64 mức chuyển tiếp, nghĩa là không đầy đủ hoàn toàn.Với ít mức chuyển tiếp, đoạn chuyển tiếp sẽ trở nên kém mượt mà.

Tuy nhiên, thực tế rất khó thấy sự khác biệt này. Vì thông thường các texture chỉ được phóng to ở khoảng nhất định. Nghĩa là chỉ có một số ít điểm ảnh chuyển tiếp giữa hai texel, nên cũng chỉ cần một số ít mức chuyển tiếp. Dù vậy, phép lọc tuyến tính còn được dùng trong các thao tác tìm màu khác (chẳng hạn trong bộ đổ bóng điểm – pixel shading) nên với ít bit hơn, độ chính xác trong kết quả cuối cùng sẽ giảm. Đương nhiên, ít bit cũng có nghĩa là ít xử lí hơn và nhanh hơn.

KIỂM NGHIỆM THỰC TẾ

Có rất nhiều công cụ và phương pháp để kiểm nghiệm những vấn đề liên quan đến các phép lọc. Nhưng có lẽ dễ dàng và quen thuộc nhất với những người chơi game hoặc am hiểu về card đồ họa là phần mềm 3DMark của FutureMark. Công cụ này có chức năng "Filtering & AA" rất trực quan. Ở đây tôi xin giới thiệu vài hướng kiểm nghiệm lí thú để thấy vai trò và ảnh hưởng qua lại của các công nghệ kể trên bằng FutureMark 3DMark05.

Chọn chức năng Filtering & AA của 3Dmark05

Trước khi chạy chức năng này, bạn phải đảm bảo driver đồ họa không "ép" bất cứ thao tác nào như AntiAliasing hay Anisotropic Filtering. Nếu không, các thay đổi trong chương trình sẽ không "nghiệm".

Ban đầu, bạn đặt Mag Filter, Min Filter về Point và MipMapping về None để xem Nearest-point sampling. Thử di chuyển, bạn sẽ thấy nhiễu. Sau đó, đưa cả ba thành Point, bạn sẽ thấy rất rõ các lớp Mipmap (nhất là khi di chuyển, đường phân định các lớp mipmap di chuyển "theo sát" bạn) và thấy luôn cả "tác hại" của việc không dùng lọc tuyến tính. Các khối vuông xuất hiện, đặc biệt khi bạn tăng mức chi tiết LOD bias lên (kéo xịch các mipmap lại gần bạn). Dùng chức năng Mipmap Coloring bạn thấy càng rõ. Bây giờ bạn chuyển Mag/Min Filter lên Linear, bạn có Bilinear. Các lớp mipmap vẫn còn rõ, nhưng nhiễu và khối vuông thì biến mất.

Bây giờ bạn đặt cả ba tham số là Linear, bạn có Trilinear. Không còn các lớp mipmap nữa. Bạn có thể thử với Mipmap Coloring. Các lớp màu giờ đã chuyển tiếp hòa trộn vào nhau.

Tiếp theo, bạn chuyển Mag/Min Filter lên Anisotropic (nếu Anisotropy level khác 1, đặt nó về 1 trước). Chẳng có khác biệt gì đáng kể cả. Như tôi đã trình bày, Anisotropic 1x gần giống với Linear Filtering do đều chỉ dùng 4 mẫu (không tính tới các lớp mipmap). Tăng dần Anisotropy Level, bạn dễ dàng phát hiện thật sự chỉ tồn tại các mức 1x, 2x, 4x, 8x, 16x. Các mức khác đều được làm tròn lên hoặc xuống các mức này. Sử dụng Mipmap Coloring để thấy rằng với mức lọc càng cao, mipmap càng bị đẩy vào sâu. Nếu card của bạn là "đời mới", sử dụng tối ưu góc trong Anisotropic Filtering, thì thật ngạc nhiên! Hầu hết các góc trong 16x và 4x được lọc giống hệt nhau!

Hầu hết các góc AF 4x và 16x được lọc giống nhau

Bây giờ thử nghiệm vì sao Anisotropic Filtering lại "hay" hơn Linear Filtering. Bạn đẩy Anisotropy Level lên 16x, và xem Bilinear/Trilinear Anisotropic Filtering (thay đổi Mipmap giữa Point và Linear). Sau đó chuyển về Trilinear (cả ba tham số đều là Linear). Bạn sẽ thấy hình rất mờ. Giảm LOD bias xuống để hình rõ hơn, bạn sẽ thấy hình "có vẻ” rõ hơn nhưng thực ra lại là nhiễu, nhất là khi bạn di chuyển.

Nếu có card GeForce 6xxx, bạn có thể thử chức năng Trilinear Optimizations bằng thiết lập trong card đồ hoạ. Tuy nhiên thay đổi không trực tiếp trong lúc chạy chương trình nên không được rõ.

Trên đây, tôi đã giới thiệu các phương pháp lọc vật liệu và cả các "bí kíp" mà các nhà sản xuất card đồ họa dùng để tăng hiệu năng đồ họa. Hi vọng bài viết có thể phần nào giúp các bạn có được cái nhìn rõ hơn về đồ họa 3D.

 

Phần texture filtering này rất quan trọng trong việc so sánh về chất lượng hình ảnh của 2 dòng GPU ,từ đó các bro có thể hiểu được tại sao người ta nói vid của ATi cho hình ảnh đẹp hơn vid của nVidia ( tuy nhiên chỉ trên lý thuyết ) . Sau bài này Rock sẽ cố gắng dịch 1 bài nữa so sánh về bộ lọc của 2 hãng này ,tuy nhiên nếu các bro không đọc và không hiểu sơ về vấn đề này thì sẽ tạo nên 1 thread tranh luận dài vài trăm trang về vấn đề này .

Antialiasing :

Antialiasing là 1 mảng khá lớn và cũng khá cũ tuy nhiên hiện tại Rock chỉ biết được 2 loại Ordered Grid Super Sampling (OGSS) và Jittered Grid Super Sampling (JGSS) ,2 lọai này ít còn sử dụng trong các game hay software vì nó làm tốn Fillrate và Bandwidth rất nhiều ,còn những kĩ thuật AA khác thì Rock đang nghiên cứu hy vọng sớm có thể dịch được và bổ sung vào phần này .

Đơn giản các kĩ thuật này làm giảm những “ Răng cưa “ ở những cạnh hình ảnh ( như chúng ta đã biết trong quá trình scan_line convertion tạo ra những artifacts dạng những răng cưa này ). Những phương pháp khử răng cưa mới giúp cho giảm những răng cưa này nhiều hơn mà tốn ít Fillrate và Bandwidth hơn.

Z_buffer and Z_stencil :
2 bộ nhớ đệm này làm việc có liên quan đến nhau do đó tôi xin mô tả chung với nhau . Như đã nói ở trên khi quá trình scan_line convertion thì chuyển các toạ độ của điểm trên model thành toạ độ của pixel ( trên monitor ) thì các giá trị Z của toạ độ trong model sẽ được ghi nhớ vào Z_buffer ,khi xuất hình ra monitor GPU sẽ biết xuất pixel nào ra ,pixel nào không nên xuất ra.

 

Nhìn trên hình bạn sẽ thấy 2 hình tam giác xám và đen ,hình tam giác đen bị hình tam giác xám chồng lên ,khi xuất ra monitor thì phần bị che phủ bởi tam giác xám sẽ không được xuất ra .
Trước tiên tất cả các giá trị của điểm Z trên tam giác màu đen sẽ được ghi vào Z_buffer ,khi render đến tam giác xám nếu những điểm của tam giác xám nằm lên những pixel mà tam giác đen đã chiếm ,thì lập tức việc so sánh giữa 2 giá trị Z của 2 điểm tương ứng ,giá trị Z nào cho thấy tam giác nằm xa hơn thì sẽ không được ghi vào Z_buffer hoặc sẽ bị xoá trên Z_buffer.
Bây giờ chuyển sang Z_Stencil buffer ,đây cũng là bộ nhớ đệm nhưng nó chứa những thông tin của các model đặc biệt ,thế nào là model đặc biệt ? ví dụ như trong những game flight simulator thì nó sẽ chứa thông tin của model tấm chắn gió của buồng lái ( HUD ), khi máy bay bay thì những model khác sẽ hiện ra phía trước HUD ,do đó HUD bao giờ cũng nằm trước tất cả những model mới xuất hiện . Tuy nhiên mỗi frame nếu có vật gì xuất hiện tại những pixel mà HUD chiếm thì nó vẫn đưa các giá trị Z của vật đó và HUD vào Z_buffer để so sánh. Nhờ vào bộ nhớ đệm này mà những model thường xuyên nằm trước các model khác không phải render lại nhiều lần ,mà chỉ thêm những texture ,hoặc effect mới mà thôi ( ví dụ như đạn bắn vào HUD ,hoặc ánh nắng chiếu vào HUD )

Tóm lại :
+ Các giai đoạn thực hiện ( texture filtering ) do TMU ( texture mapping units ) thực hiện ,trong khi đó (antiliasing ,shadow ,Z_buffer, Z_stencil ) thì do ROPs thực hiện ( Raster operation units )
+ Tốc độ của ROPs và TMU thể hiện ở pixel fillrate và texture fillrate ( có thể gọi là tốc độ phủ các pixel và tốc độ phủ các texture ) 2 cái này có gì khác nhau ? .Khi 1 model được xuất ra monitor thì trên model đó sẽ được phủ nhiều texture .
Ví dụ : 1 vid có 16 ROPs ,32 TMU và có core clock là 100Mhz ,khi xuất ra 1 vật/model thì nó chỉ xuất ra được tối đa là 16 pixels và mỗi pixel này chỉ có 1 texture duy nhất ,vid có core clock là 100 Mhz thì nó có số pixel fillrate là 100Mhz x 16 = 1600 pixels/s
Vid đó có khả năng gắn được 32 texture lên 1 pixel trong 1 clock có nghĩa là số texture fillrate = 100MHz x32 texture /s , hoặc xuất được 2 pixels mỗi pixel có 16 textures ,tuy nhiên số lượng pixel giới hạn vẫn là 16 pixels ( mỗi pixel có 2 textures ) .

Trước đây tỉ lệ PSP:TMU:ROP của dòng card đồ hoạ cũ là 1:1:1 và hoạt động cùng xung nhịp nên dễ nhớ, gọi chung nó là Pixel pipeline (đường ống lệnh)
GPU cao cấp có số lượng pixel pipelines nhiều hơn đáng kể so với VGA dòng trung/ thấp cấp. Các ống lệnh hoạt động đồng thời nên GPU nào nhiều ống lệnh hơn thì xử lý hình ảnh nhanh hơn

VGA có 8 pixel pipelines thì tối đa 1 giây pixel fillrate = core speed x 8pp, VGA có 16-24pp đương nhiên xử lý đc nhiều hơn 2-3 lần so với 8pp

Nói đến tốc độ bộ xử lý có lẽ người ta coi 1Mhz là nhỏ nhất, ko phải suy ra nó = 1 triệu Hz

PSP = Pixel Shader Processor
TMU = Texture Mapping Unit
ROP = Raster Operation

01.
© Oliver / All rights reserved.
To top