Metal語言的限制
Metal中不支持C++11.0的如下特性:
Lambda表達式
遞歸函數調用
動態轉換操作符
類型識別
對象創建new和銷毀delete操作符
操作符noexcept
go跳轉
變量存儲修飾符 register 和thread_local
虛函數修飾符
派生類
異常處理
C++標準庫在Metal語言中也不可使用
Metal語言對于指針使用的限制
Metal圖形和并行計算函數用到的入參(比如指針 / 引用),如果是指針 / 引用必須使用地址空間修飾符(比如device、threadgroup、constant)
不支持函數指針
函數名不能出現main
Metal 基本數據類型
基本數據類型主要有:
標量
向量
矩陣
標量
Metal中的標量類型如下圖所示
常用的主要有 bool、int、uint 、half
undigned char可以簡寫為 uchar
unsigned short 可以簡寫為 ushort
unsigned int 可以簡寫為 uint
其中half?相當于OC中的float,float?相當于OC中的double
size_t用來表示內存空間, 相當于 OC中?sizeof
bool a = true;
char b = 5;
int ?d = 15;
//用于表示內存空間
size_t c = 1;
ptrdiff_t f = 2;
向量
向量支持如下類型
- booln、charn、shortn、intn、ucharn、ushortn、uintn、halfn、floatn,其中 n 表示向量的維度,最多不超過4維向量
//直接賦值初始化
bool2 A= {1,2};
//通過內建函數float4初始化
float4 pos = float4(1.0,2.0,3.0,4.0);
//通過下標從向量中獲取某個值
float x = pos[0];
float y = pos[1];
//通過for循環對一個向量進行運算
float4 VB;
for(int i = 0; i < 4 ; i++)
{
? ?VB[i] = pos[i] * 2.0f;
}
在OpenGL ES的GLSL語言中,例如2.0f,在著色器中書寫時,是不能加f,寫成2.0,而在Metal中則可以寫成2.0f,其中f可以是大寫,也可以是小寫
向量的訪問規則
通過向量字母獲取元素: 向量中的向量字母僅有2種,分別為xyzw、rgba
int4 test = int4(0,1,2,3);
int a = test.x; //獲取的向量元素0
int b = test.y; //獲取的向量元素1
int c = test.z; //獲取的向量元素2
int d = test.w; //獲取的向量元素3
int e = test.r; //獲取的向量元素0
int f = test.g; //獲取的向量元素1
int g = test.b; //獲取的向量元素2
int h = test.a; //獲取的向量元素3
多個分量同時訪問
float4 c;
c.xyzw = float4(1.0f,2.0f,3.0f,4.0f);
c.z = 1.0f;
c.xy = float2(3.0f,4.0f);
c.xyz = float3(3.0f,4.0f,5.0f);
多分量訪問可以亂序/重復
賦值時分量不可重復,取值時分量可重復
右邊是取值?和?左邊賦值都合法
xyzw與rgba不能混合使用
float4 pos = float4(1.0f,2.0f,3.0f,4.0f);
//向量分量逆序訪問
float4 swiz = pos.wxyz; ?//swiz = (4.0,1.0,2.0,3.0);
//向量分量重復訪問
float4 dup = pos.xxyy; ?//dup = (1.0f,1.0f,2.0f,2.0f);
//可以僅對 xw / wx 修改
//pos = (5.0f,2.0,3.0,6.0)
pos.xw = float2(5.0f,6.0f);
//pos = (8.0f,2.0f,3.0f,7.0f)
pos.wx = float2(7.0f,8.0f);
//可以僅對 xyz 進行修改
//pos = (3.0f,5.0f,9.0f,7.0f);
pos.xyz = float3(3.0f,5.0f,9.0f);
float2 pos;
pos.x = 1.0f; //合法
pos.z = 1.0f; //非法,pos是二維向量,沒有z這個索引
float3 pos2;
pos2.z = 1.0f; //合法
pos2.w = 1.0f; //非法
// 賦值 時 分量不可重復,取值 時 分量可重復
//非法,x出現2次
pos.xx = float2(3.0,4.0f);
pos.xy = swiz.xx;
//向量中xyzw與rgba兩組分量不能混合使用
float4 pos4 = float4(1.0f,2.0f,3.0f,4.0f);
pos4.x = 1.0f;
pos4.y = 2.0f;
//非法,.rgba與.xyzw 混合使用
pos4.xg = float2(2.0f,3.0f);
////非法,.rgba與.xyzw 混合使用
float3 coord = pos4.ryz;
GLSL中向量不能亂序訪問,只是和Metal中的向量相似,并不是等價。
矩陣
矩陣支持如下類型
-?halfnxm、floatnxm,其中?nxm表示矩陣的行數和列數,最多4行4列,其中half、float相當于OC中的float、double
- 普通的矩陣其本質就是一個數組
float4x4 m;
//將第二行的所有值都設置為2.0
m[1] = float4(2.0f);
//設置第一行/第一列為1.0f
m[0][0] = 1.0f;
//設置第三行第四列的元素為3.0f
m[2][3] = 3.0f;
float4 類型向量的構造方式
1個float構成,表示一行都是這個值
4個float構成
2個float2構成
1個float2+2個float構成(順序可以任意組合)
1個float2+1個float
1個float4
//float4類型向量的所有可能構造方式
//1個一維向量,表示一行都是x
float4(float x);/
//4個一維向量 --> 4維向量
float4(float x,float y,float z,float w);
//2個二維向量 --> 4維向量
float4(float2 a,float2 b);
//1個二維向量+2個一維向量 --> 4維向量
float4(float2 a,float b,float c);
float4(float a,float2 b,float c);
float4(float a,float b,float2 c);
//1個三維向量+1個一維向量 --> 4維向量
float4(float3 a,float b);
float4(float a,float3 b);
//1個四維向量 --> 4維向量
float4(float4 x);
float3 類型向量的構造方式
1個float構成,表示一行都是這個值
3個float
1個float+1個float2(順序可以任意組合)
1個float2
//float3類型向量的所有可能的構造的方式
//1個一維向量
float3(float x);
//3個一維向量
float3(float x,float y,float z);
//1個一維向量 + 1個二維向量
float3(float a,float2 b);
//1個二維向量 + 1個一維向量
float3(float2 a,float b);
//1個三維向量
float3(float3 x);
float2 類型向量的構造方式
1個float構成,表示一行都是這個值
2個float
1個float2
//float2類型向量的所有可能的構造方式
//1個一維向量
float2(float x);
//2個一維向量
float2(float x,float y);
//1個二維向量
float2(float2 x);
Metal 其他類型
主要有以下兩種
紋理
采樣器
紋理類型
紋理類型是一個句柄,指向一維/二維/三維紋理數據,而紋理數據對應一個紋理的某個level的mipmap的全部或者一部分
紋理的訪問權限
在一個函數中描述紋理對象的類型
access枚舉值由Metal定義,定義了紋理的訪問權利?enum class access {sample, read, write};,有以下3種訪問權利,當沒寫access時,默認的access 就是?sample
sample: 紋理對象可以被采樣(即使用采樣器去紋理中讀取數據,相當于OpenGL ES的GLSL中sampler2D),采樣一維這時使用 或者 不使用都可以從紋理中讀取數據(即可讀可寫可采樣)
read:不使用采樣器,一個圖形渲染函數?或者?一個并行計算函數可以讀取紋理對象(即僅可讀)
write:一個圖形渲染函數 或者 一個并行計算可以向紋理對象寫入數據(即?可讀可寫)
定義紋理類型
描述一個紋理對象/類型,有以下三種方式,分別對應一維/二維/三維,
其中T代表?泛型,設定了從紋理中讀取數據 或是 寫入時的顏色類型,T可以是half、float、short、int等
access表示紋理訪問權限,當access沒寫時,默認是sample
texture1d<T, access a = access::sample>
texture2d<T, access a = access::sample>
texture3d<T, access a = access::sample>
//類型 變量 修飾符
/*
類型
? ?- texture2d<float>,讀取的數據類型是float,沒寫access,默認是sample
? ?- texture2d<float,access::read>,讀取的數據類型是float,讀取的方式是read
? ?- texture2d<float,access::write>,讀取的數據類型是float,讀取的方式是write
變量名
? ?- imgA
? ?- imgB
? ?- imgC
修飾符
? ?- [[texture(0)]] 對應紋理0
? ?- [[texture(1)]] 對應紋理1
? ?- [[texture(2)]] 對應紋理2
*/
void foo (texture2d<float> imgA[[texture(0)]],
? ? ? ? ?texture2d<float,access::read> imgB[[texture(1)]],
? ? ? ? ?texture2d<float,access::write> imgC[[texture(2)]])
{
? ?//...
}
采樣器類型 Samplers
采樣器類型決定了如何對一個紋理進行采樣操作,在Metal框架中有一個對應著色器語言的采樣器的對象MTLSamplerState,這個對象作為圖形渲染著色器函數參數?或是?并行計算函數的參數傳遞,有以下幾種狀態:
coord:從紋理中采樣時,紋理坐標是否需要歸一化
enum class coord { normalized, pixel };
filter:紋理采樣過濾方式,放大/縮小過濾方式
enum class filter { nearest, linear };
min_filter:設置紋理采樣的縮小過濾方式
enum class min_filter { nearest, linear };
mag_filter:設置紋理采樣的放大過濾方式
enum class mag_filter { nearest, linear };
s_address、t_address、r_address:設置紋理s、t、r坐標(對應紋理坐標的x、y、z)的尋址方式
s坐標:enum class s_address { clamp_to_zero, clamp_to_edge, repeat, mirrored_repeat };
t坐標:enum class t_address { clamp_to_zero, clamp_to_edge, repeat, mirrored_repeat };
r坐標:enum class r_address { clamp_to_zero, clamp_to_edge, repeat, mirrored_repeat };
address:設置所有紋理坐標的尋址方式
enum class address { clamp_to_zero, clamp_to_edge, repeat, mirrored_repeat };
mip_filter:設置紋理采樣的mipMap過濾模式, 如果是none,那么只有一層紋理生效;
enum class mip_filter { none, nearest, linear };
采樣器所有狀態如圖所示
1、openGL ES中紋理坐標對應的是stq,Metal中紋理坐標對應是str
2、在Metal程序中初始化的采樣器必須使用constexpr修飾符聲明
/*
constexpr:修飾符(必須寫)
sampler:類型
s:采樣器變量名稱
參數
? ?- coord: 是否需要歸一化,不需要歸一化,用的是像素pixel
? ?- address: 地址環繞方式
? ?- filter: 過濾方式
*/
constexpr sampler s(coord::pixel, address::clamp_to_zero, filter::linear);
constexpr sampler a(coord::normalized);
constexpr sampler b(address::repeat);
函數修飾符
Metal有以下3中函數修飾符,放在函數的最前面,即位于函數返回值的前面
kernel:表示該函數是一個數據并行計算著色函數,它可以被分配在一維/二維/三維線程組中去執行,表示函數要并行計算,其返回值類型必須是void類型,是一個高并發函數
vertex:表示該函數是一個頂點著色函數,它將為頂點數據流中的每個頂點數據執行一次,然后為每個頂點生成數據輸出到繪制管線
fragment:表示該函數是一個片元著色函數,它將為片元數據流中的每個片元 和其相關聯的數據執行一次,然后將每個片元生成的顏色數據輸出到繪制管線中
1、使用kernel修飾的函數,其返回值類型必須是void類型
2、一個被函數修飾符修飾的函數不能在調用其他也被函數修飾符修飾的函數,這樣會導致編譯失敗,即Kernel、vertex、fragment修飾的函數不能相互調用,也不能同修飾符函數相互調用。但是可以調用普通函數
3、被函數修飾符修飾過的函數,只允許在客戶端對其進行操作.?不允許被普通的函數調用
4、Metal中并不是所有函數都需要上述3個修飾符修飾,是可以在Metal中定義普通函數的,即不帶任何修飾符的函數
5、只有圖形著色函數才可以被vertex和fragment修飾,對于圖形著色函數,通過返回值類型可以辨認出是為頂點計算還是像素計算,其返回值也可以是void,意味著不產生數據輸出到繪制管線,是一個無意義的動作
//并行計算函數(kernel)
kernel void CCTestKernelFunctionA(int a,int b)
{?
? ?/*
? ? 注意:
? ? 1. 使用kernel 修飾的函數返回值必須是void 類型
? ? 2. 一個被函數修飾符修飾過的函數,不允許在調用其他的被函數修飾過的函數. 非法
? ? 3. 被函數修飾符修飾過的函數,只允許在客戶端對其進行操作. 不允許被普通的函數調用.
? ? */
? ?//不可以的!
? ?//一個被函數修飾符修飾過的函數,不允許在調用其他的被函數修飾過的函數. 非法
? ?CCTestKernelFunctionB(1,2);//非法,錯誤調用!!!
? ?CCTestVertexFunctionB(1,2);//非法,錯誤調用!!!
? ?//可以! 你可以調用普通函數.而且在Metal 不僅僅只有這3種被修飾過的函數.普通函數也可以存在
? ?CCTest();
}
//并行計算函數
kernel void CCTestKernelFunctionB(int a,int b)
{
? ?.....
}
//頂點函數
vertex int CCTestVertexFunctionB(int a,int b)
{
? ?.....
}
//片元函數
fragment int CCTestVertexFunctionB(int a,int b)
{
? ?.....
}
//普通函數
void CCTest()
{
? ?.....
}
變量、參數的地址空間修飾符
Metal著色器語言使用地址空間修飾符來表示一個?函數變量?或者?參數變量?被分配于哪一片內存區域,有以下4中地址空間修飾符
device: 設備地址空間
threadgroup: 線程組地址空間
constant?常量地址空間
thread?線程地址空間
1、所有的著色函數(vertex、fragment、kernel)的參數,如果是指針/引用,都必須帶有地址空間修飾符號
2、對于圖形著色器函數(即vertex/fragment修飾的函數),其指針/引用類型的參數必須定義為?device、constant地址空間
3、對于并行計算函數(即kernel修飾的函數),其指針/引用類型的參數必須定義為?device、threadgroup、constant
4、并不是所有的變量都需要修飾符,也可以定義普通變量(即無修飾符的變量)
/*
注意:
1. 所有被(kernel,vertex,fragment)所修飾的參數變量,如果其類型是指針/引用 都必須帶有地址空間修飾符.
2. 被fragment修飾的片元函數, 指針/引用必須被device/constant/threadgroup
*/
//變量/參數地址空間修飾符
void CCTestFouncitionE(device int *g_data,
? ? ? ? ? ? ? ? ? ? ? threadgroup int *l_data,
? ? ? ? ? ? ? ? ? ? ? constant float *c_data
? ? ? ? ? ? ? ? ? ? ? )
{
? ?//...
}
device:設備地址空間修飾符
設備地址空間指向設備內存池分配出來的緩存對象(設備指顯存,即GPU),即GPU空間分配的緩存對象,它是可讀可寫的,一個緩存對象可以被聲明成一個標量、向量或是用戶自定義結構體的指針/引用
device放在變量類型之前
除了可以修飾?圖形著色器函數 / 并行計算函數參數,還可以修飾指針變量 和 結構體指針變量
// 設備地址空間: device 用來修飾指針.引用
//1.修飾指針變量
device float4 *color;
struct CCStruct{
? ?float a[3];
? ?int b[2];
};
//2.修飾結構體類的指針變量
device CCStruct *my_CS;
1、紋理對象總是在設備地址空間分配內存,即紋理對象默認在GPU分配內存
2、device地址空間修飾符不必出現在紋理類型定義中
3、一個紋理對象的內容無法直接訪問,Metal提供讀寫紋理的內建函數,通過內建函數訪問紋理對象
threadgroup:線程組地址空間修飾符
線程組地址空間用于為并行計算著色器函數分配內存變量,這些變量被一個線程組的所有線程共享,在線程組地址空間分配的變量不能用于圖形繪制著色函數(即頂點著色函數 / 片元著色函數),即在圖形繪制著色函數中不能使用線程組
在并行計算著色函數中,在線程組地址空間分配的變量為一個線程組使用,生命周期和線程組相同
/*
1. threadgroup 被并行計算計算分配內存變量, 這些變量被一個線程組的所有線程共享. 在線程組分配變量不能被用于圖像繪制.
2. thread 指向每個線程準備的地址空間. 在其他線程是不可見切不可用的
*/
kernel void CCTestFouncitionF(threadgroup float *a)
{
? ?//在線程組地址空間分配一個浮點類型變量x
? ?threadgroup float x;
? ?//在線程組地址空間分配一個10個浮點類型數的數組y;
? ?threadgroup float y[10];
}
constant:常量地址空間修飾符
常量地址空間指向的緩存對象也是從設備內存池分配存儲,僅可讀
在程序域的變量必須定義在常量地址空間并且聲明時初始化,用來初始化的值必須是編譯時的常量
在程序域的變量的生命周期和程序一樣,在程序中的并行計算著色函數 或者 圖形繪制著色函數調用,但是constant的值會保持不變
常量地址空間的指針/引用可以作為函數的參數,向聲明為常量的變量賦值會產生編譯錯誤
2、聲明常量但是沒有賦予初值也會產生編譯錯誤
constant float samples[] = { 1.0f, 2.0f, 3.0f, 4.0f };
//對一個常量地址空間的變量進行修改也會失敗,因為它只讀的
sampler[4] = {3,3,3,3}; //編譯失敗;?
//定義為常量地址空間聲明時不賦初值也會編譯失敗
constant float a;
thread:線程地址空間修飾符
線程地址空間指向每個線程準備的地址空間,也是在GPU中,該線程的地址空間定義的變量在其他線程不可見(即變量不共享)
在圖形繪制著色函數 或者 并行計算著色函數中聲明的變量,在線程地址空間分配存儲
kernel void CCTestFouncitionG(void)
{
? ?//在線程空間分配空間給x,p
? ?float x;
? ?thread float p = &x;
}
函數參數與變量的傳遞修飾符,即屬性修飾符
圖形繪制 或者 并行計算著色器函數的輸入輸出都是通過參數傳遞,除了常量地址空間變量和程序域定義的采樣器之外, 其他參數修飾的可以是如下之一,有以下5種屬性修飾符:
device buffer?設備緩存:一個指向設備地址空間的任意數據類型的指針/引用
constant buffer?常量緩存:一個指向常量地址空間的任意數據類型的指針/引用
texture?紋理對象
sampler?采樣器對象
threadGroup?在線程組中供線程共享的緩存
為什么需要屬性修飾符?
參數表示資源的定位,可以理解為端口,相當于OpenGl ES中的location
在固定管線和可編程管線進行內建變量的傳遞
將數據沿著渲染管線從頂點函數傳遞到片元函數
傳遞修飾符在代碼中的體現
對于每個著色函數來說,一個修飾符是必須指定的,它用來設置一個緩存、紋理、采樣器的位置,傳遞修飾符對應的寫法如下:
device buffer?--->?[[buffer(index)]]
constant buffer?--->?[[buffer(index)]]
texture?--->?[[texture(index)]]
sampler?--->?[[sampler(index)]]
threadGroup?--->?[[threadGroup(index)]]
在代碼中的表現如下:
1.已知條件:device buffer(設備緩存)/constant buffer(常量緩存)
代碼表現:[[buffer(index)]]
解讀:不變的buffer ,index 可以由開發者來指定.
2.已知條件:texture Object(紋理對象)
代碼表現: [[texture(index)]]
解讀:不變的texture ,index 可以由開發者來指定.
3.已知條件:sampler Object(采樣器對象)
代碼表示: [[sampler(index)]]
解讀:不變的sampler ,index 可以由開發者來指定.
4.已知條件:threadgroup Object(線程組對象)
代碼表示: [[threadgroup(index)]]
解讀:不變的threadgroup ,index 可以由開發者來指定.
1、index是一個unsigned interger類型的值,表示了一個緩存、紋理、采樣器參數的位置(即在函數參數索引表中的位置,相當于OpenGl ES中的location)
2、從語法上來說,屬性修飾符的聲明位置應該位于參數變量名之后
//并行計算著色器函數add_vectros ,實現2個設備地址空間中的緩存A與緩存B相加.然后將結果寫入到緩存out.
//屬性修飾符"(buffer(index))" 為著色函數參數設定了緩存的位置
//thread_position_in_grid:用于表示當前節點在多線程網格中的位置,并不需要開發者傳遞,是Metal自帶的。
/*
kernel:并行計算函數修飾符
void:函數返回值類型
add_vectros:函數名
const device float4 *inA [[buffer(0)]]:定義了一個float4類型的指針,指向一個4維向量空間,放在設備內存空間(即顯存GPU中)
? ?- const device:只決定放在哪里
? ?- inA:變量名
? ?- [[buffer(0)]] 對應 buffer中0這個id
*/
kernel void add_vectros(
? ? ? ? ? ? ? ?const device float4 *inA [[buffer(0)]],
? ? ? ? ? ? ? ?const device float4 *inB [[buffer(1)]],
? ? ? ? ? ? ? ?device float4 *out [[buffer(2)]],
? ? ? ? ? ? ? ?uint id[[thread_position_in_grid]])
{
? ?out[id] = inA[id] + inB[id];
}
//著色函數的多個參數使用不同類型的屬性修飾符的情況
//紋理讀取的方式的sampler,即采樣器,[[sampler(0)]]表示采樣器的緩存id
kernel void my_kernel(device float4 *p [[buffer(0)]],
? ? ? ? ? ? ? ? ? ? ?texture2d<float> img [[texture(0)]],
? ? ? ? ? ? ? ? ? ? ?sampler sam [[sampler(0)]])
{
? ?//.....
}
常見的內建變量修飾符
[[vertex_id]]?:頂點id標識符,并不由開發者傳遞
[[position]]
在頂點著色函數中,表示當前的頂點信息,類型是float4、
還可以表示描述了片元的窗口的相對坐標(x,y,z,1/w),即該像素點在屏幕上的位置信息
[[point_size]]?:點的大小,類型是float
[[color(m)]]?:顏色,m在編譯前就必須確定
//定義了片元輸入的結構體,
struct MyFragmentOutput {
? ? ?// color attachment 0 顏色附著點0
float4 clr_f [[color(0)]];?
? ? // color attachment 1 顏色附著點1
int4 clr_i [[color(1)]];?
? ? // color attachment 2 顏色附著點2
uint4 clr_ui [[color(2)]];?
};
fragment MyFragmentOutput my_frag_shader( ... )?
{
? ?MyFragmentOutput f;
? ?....
? ?f.clr_f = ...;
? ?....
return f;?
}
[[stage_in]]?:片元著色函數使用的單個片元輸入數據是由頂點著色函數輸出然后經過光柵化生成的(即由頂點著色函數之后的顏色傳遞到片元著色函數),類似于GLSL中的varying傳遞紋理/顏色
頂點和片元著色器函數都只能有一個參數被聲明為使用stage_in修飾符(即有且僅有一個)
對于一個使用了stage_in修飾符的自定義結構體,其成員可以為一個整型/浮點類型標量,或是整型/浮點類型向量