@@ -41,22 +41,6 @@ const InitParamsNonAccel PopulateParams::initParametersGemmGfx1100[PopulateParam
4141};
4242// END_GEMM_NonAccel_f32_gfx1100_DEFS
4343
44- // BEGIN_GEMM_NonAccel_f32_gfx1200_DEFS
45- const InitParamsNonAccel PopulateParams::initParametersGemmGfx1200[PopulateParams::nInitParametersGemmGfx1200] = {
46- {128 ,128 ,128 ,8 ,4 ,4 ,1 ,1 ,2 },
47- {64 ,64 ,32 ,16 ,4 ,2 ,1 ,1 ,2 },
48- {64 ,64 ,32 ,16 ,2 ,4 ,1 ,1 ,2 },
49- {64 ,32 ,64 ,16 ,4 ,2 ,1 ,1 ,2 },
50- {64 ,128 ,64 ,16 ,4 ,4 ,1 ,1 ,2 },
51- {64 ,64 ,32 ,16 ,4 ,4 ,1 ,1 ,2 },
52- {256 ,128 ,128 ,4 ,2 ,4 ,1 ,1 ,2 },
53- {64 ,128 ,64 ,8 ,2 ,4 ,1 ,1 ,2 },
54- {64 ,128 ,64 ,8 ,4 ,4 ,1 ,1 ,2 },
55- {64 ,32 ,32 ,16 ,2 ,2 ,1 ,1 ,2 },
56- {128 ,128 ,64 ,16 ,4 ,2 ,1 ,1 ,2 }
57- };
58- // END_GEMM_NonAccel_f32_gfx1200_DEFS
59-
6044// BEGIN_CONV_NonAccel_f32_gfx1000_DEFS
6145const InitParamsNonAccel PopulateParams::initParametersConvGfx1000[PopulateParams::nInitParametersConvGfx1000] = {
6246 {128 ,128 ,128 ,4 ,2 ,4 ,1 ,1 ,2 },
@@ -148,6 +132,20 @@ const InitParamsNonAccel PopulateParams::initParametersConvGfx1200[PopulateParam
148132};
149133// END_CONV_NonAccel_f32_gfx1200_DEFS
150134
135+ // BEGIN_GEMM_NonAccel_f32_gfx1201_DEFS
136+ const InitParamsNonAccel PopulateParams::initParametersGemmGfx1201[PopulateParams::nInitParametersGemmGfx1201] = {
137+ {128 ,128 ,128 ,16 ,2 ,2 ,1 ,1 ,2 },
138+ {128 ,128 ,128 ,8 ,2 ,4 ,1 ,1 ,2 },
139+ {64 ,64 ,128 ,8 ,2 ,2 ,1 ,1 ,2 },
140+ {64 ,128 ,64 ,16 ,2 ,2 ,1 ,1 ,2 },
141+ {64 ,64 ,32 ,16 ,2 ,4 ,1 ,1 ,2 },
142+ {64 ,64 ,64 ,8 ,2 ,2 ,1 ,1 ,2 },
143+ {64 ,64 ,64 ,16 ,2 ,2 ,1 ,1 ,2 },
144+ {64 ,128 ,32 ,16 ,2 ,4 ,1 ,1 ,2 },
145+ {128 ,32 ,32 ,16 ,2 ,2 ,1 ,1 ,2 }
146+ };
147+ // END_GEMM_NonAccel_f32_gfx1201_DEFS
148+
151149#endif
152150
153151#ifdef NonAccel_DECLARATIONS_GEN
@@ -162,11 +160,6 @@ static constexpr size_t nInitParametersGemmGfx1100 = 13;
162160static const InitParamsNonAccel initParametersGemmGfx1100[nInitParametersGemmGfx1100];
163161// END_GEMM_NonAccel_f32_gfx1100_DECS
164162
165- // BEGIN_GEMM_NonAccel_f32_gfx1200_DECS
166- static constexpr size_t nInitParametersGemmGfx1200 = 11 ;
167- static const InitParamsNonAccel initParametersGemmGfx1200[nInitParametersGemmGfx1200];
168- // END_GEMM_NonAccel_f32_gfx1200_DECS
169-
170163// BEGIN_CONV_NonAccel_f32_gfx1000_DECS
171164static constexpr size_t nInitParametersConvGfx1000 = 24 ;
172165static const InitParamsNonAccel initParametersConvGfx1000[nInitParametersConvGfx1000];
@@ -182,6 +175,11 @@ static constexpr size_t nInitParametersConvGfx1200 = 27;
182175static const InitParamsNonAccel initParametersConvGfx1200[nInitParametersConvGfx1200];
183176// END_CONV_NonAccel_f32_gfx1200_DECS
184177
178+ // BEGIN_GEMM_NonAccel_f32_gfx1201_DECS
179+ static constexpr size_t nInitParametersGemmGfx1201 = 9 ;
180+ static const InitParamsNonAccel initParametersGemmGfx1201[nInitParametersGemmGfx1201];
181+ // END_GEMM_NonAccel_f32_gfx1201_DECS
182+
185183#endif
186184
187185#ifdef XDL_DEFINITIONS_GEN
@@ -1096,37 +1094,6 @@ const InitParamsAccel PopulateParamsWmma::initParametersFp16GemmGfx1100[Populate
10961094};
10971095// END_GEMM_Wmma_f16_gfx1100_DEFS
10981096
1099- // BEGIN_GEMM_Wmma_f16_gfx1200_DEFS
1100- const InitParamsAccel PopulateParamsWmma::initParametersFp16GemmGfx1200[PopulateParamsWmma::nInitParametersFp16GemmGfx1200] = {
1101- {128 ,128 ,2 ,128 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1102- {128 ,128 ,4 ,32 ,64 ,8 ,1 ,1 ,2 ,true ,true },
1103- {128 ,256 ,4 ,64 ,64 ,8 ,1 ,2 ,2 ,true ,true },
1104- {128 ,64 ,8 ,64 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1105- {64 ,256 ,4 ,32 ,64 ,8 ,1 ,1 ,2 ,true ,true },
1106- {64 ,64 ,4 ,32 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1107- {32 ,128 ,8 ,32 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1108- {32 ,32 ,8 ,16 ,16 ,8 ,1 ,2 ,2 ,true ,true },
1109- {64 ,128 ,4 ,64 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1110- {32 ,64 ,8 ,16 ,64 ,8 ,1 ,2 ,2 ,true ,true },
1111- {16 ,32 ,8 ,16 ,16 ,8 ,1 ,2 ,2 ,true ,true },
1112- {128 ,128 ,8 ,32 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1113- {256 ,128 ,2 ,128 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1114- {32 ,64 ,4 ,32 ,16 ,4 ,1 ,2 ,2 ,true ,true },
1115- {256 ,128 ,8 ,64 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1116- {16 ,16 ,8 ,16 ,16 ,16 ,1 ,2 ,2 ,true ,true },
1117- {64 ,64 ,2 ,32 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1118- {16 ,64 ,8 ,16 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1119- {64 ,32 ,8 ,16 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1120- {64 ,256 ,8 ,32 ,64 ,4 ,1 ,2 ,2 ,true ,true },
1121- {16 ,32 ,8 ,16 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1122- {128 ,256 ,8 ,64 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1123- {16 ,16 ,8 ,16 ,16 ,16 ,1 ,1 ,2 ,true ,true },
1124- {32 ,64 ,4 ,32 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1125- {128 ,128 ,8 ,32 ,64 ,16 ,1 ,1 ,2 ,true ,true },
1126- {128 ,256 ,4 ,16 ,64 ,4 ,1 ,1 ,2 ,true ,true }
1127- };
1128- // END_GEMM_Wmma_f16_gfx1200_DEFS
1129-
11301097// BEGIN_CONV_Wmma_f16_gfx1000_DEFS
11311098const InitParamsAccel PopulateParamsWmma::initParametersFp16ConvGfx1000[PopulateParamsWmma::nInitParametersFp16ConvGfx1000] = {
11321099 {128 ,64 ,8 ,32 ,64 ,8 ,1 ,1 ,2 ,true ,true },
@@ -1405,20 +1372,6 @@ const InitParamsAccel PopulateParamsWmma::initParametersI8GemmGfx1100[PopulatePa
14051372};
14061373// END_GEMM_Wmma_i8_gfx1100_DEFS
14071374
1408- // BEGIN_GEMM_Wmma_i8_gfx1200_DEFS
1409- const InitParamsAccel PopulateParamsWmma::initParametersI8GemmGfx1200[PopulateParamsWmma::nInitParametersI8GemmGfx1200] = {
1410- {128 ,64 ,8 ,32 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1411- {256 ,128 ,4 ,64 ,32 ,16 ,1 ,2 ,2 ,true ,true },
1412- {128 ,64 ,4 ,32 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1413- {128 ,64 ,2 ,32 ,64 ,16 ,1 ,2 ,2 ,true ,true },
1414- {32 ,32 ,8 ,16 ,32 ,16 ,1 ,2 ,2 ,true ,true },
1415- {128 ,128 ,2 ,128 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1416- {128 ,256 ,4 ,128 ,32 ,16 ,1 ,2 ,2 ,true ,true },
1417- {128 ,32 ,8 ,64 ,16 ,16 ,1 ,1 ,2 ,true ,true },
1418- {64 ,64 ,8 ,16 ,16 ,16 ,1 ,2 ,2 ,true ,true }
1419- };
1420- // END_GEMM_Wmma_i8_gfx1200_DEFS
1421-
14221375// BEGIN_CONV_Wmma_i8_gfx1000_DEFS
14231376const InitParamsAccel PopulateParamsWmma::initParametersForwardI8ConvGfx1000[PopulateParamsWmma::nInitParametersForwardI8ConvGfx1000] = {
14241377 {128 ,64 ,8 ,32 ,64 ,16 ,1 ,1 ,2 ,true ,true },
@@ -1477,6 +1430,43 @@ const InitParamsAccel PopulateParamsWmma::initParametersForwardI8ConvGfx1200[Pop
14771430};
14781431// END_CONV_Wmma_i8_gfx1200_DEFS
14791432
1433+ // BEGIN_GEMM_Wmma_i8_gfx1201_DEFS
1434+ const InitParamsAccel PopulateParamsWmma::initParametersI8GemmGfx1201[PopulateParamsWmma::nInitParametersI8GemmGfx1201] = {
1435+ {128 ,64 ,4 ,64 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1436+ {32 ,32 ,8 ,16 ,16 ,16 ,1 ,2 ,2 ,true ,true },
1437+ {256 ,64 ,4 ,32 ,64 ,16 ,1 ,1 ,2 ,true ,true },
1438+ {128 ,32 ,4 ,32 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1439+ {128 ,128 ,2 ,128 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1440+ {128 ,256 ,8 ,64 ,64 ,8 ,1 ,1 ,2 ,true ,true },
1441+ {256 ,128 ,4 ,128 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1442+ {256 ,256 ,8 ,128 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1443+ {128 ,16 ,8 ,32 ,16 ,16 ,1 ,2 ,2 ,true ,true },
1444+ {16 ,128 ,8 ,16 ,32 ,16 ,1 ,1 ,2 ,true ,true },
1445+ {256 ,128 ,8 ,64 ,64 ,8 ,1 ,2 ,2 ,true ,true },
1446+ {128 ,256 ,2 ,128 ,64 ,8 ,1 ,1 ,2 ,true ,true },
1447+ {64 ,64 ,8 ,32 ,32 ,16 ,1 ,1 ,2 ,true ,true }
1448+ };
1449+ // END_GEMM_Wmma_i8_gfx1201_DEFS
1450+
1451+ // BEGIN_GEMM_Wmma_f16_gfx1201_DEFS
1452+ const InitParamsAccel PopulateParamsWmma::initParametersFp16GemmGfx1201[PopulateParamsWmma::nInitParametersFp16GemmGfx1201] = {
1453+ {128 ,64 ,4 ,64 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1454+ {128 ,128 ,8 ,32 ,128 ,8 ,1 ,1 ,2 ,true ,true },
1455+ {128 ,128 ,2 ,128 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1456+ {16 ,32 ,8 ,16 ,16 ,8 ,1 ,1 ,2 ,true ,true },
1457+ {128 ,256 ,4 ,64 ,64 ,8 ,1 ,2 ,2 ,true ,true },
1458+ {32 ,64 ,8 ,32 ,16 ,8 ,1 ,2 ,2 ,true ,true },
1459+ {16 ,16 ,8 ,16 ,16 ,16 ,1 ,2 ,2 ,true ,true },
1460+ {64 ,64 ,8 ,32 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1461+ {64 ,32 ,8 ,16 ,32 ,8 ,1 ,1 ,2 ,true ,true },
1462+ {256 ,64 ,4 ,32 ,64 ,8 ,1 ,1 ,2 ,true ,true },
1463+ {64 ,64 ,4 ,64 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1464+ {256 ,128 ,2 ,128 ,64 ,8 ,1 ,2 ,2 ,true ,true },
1465+ {128 ,128 ,8 ,32 ,32 ,8 ,1 ,2 ,2 ,true ,true },
1466+ {16 ,128 ,4 ,16 ,128 ,16 ,1 ,1 ,2 ,true ,true }
1467+ };
1468+ // END_GEMM_Wmma_f16_gfx1201_DEFS
1469+
14801470#endif
14811471
14821472#ifdef Wmma_DECLARATIONS_GEN
@@ -1491,11 +1481,6 @@ static constexpr size_t nInitParametersFp16GemmGfx1100 = 21;
14911481static const InitParamsAccel initParametersFp16GemmGfx1100[nInitParametersFp16GemmGfx1100];
14921482// END_GEMM_Wmma_f16_gfx1100_DECS
14931483
1494- // BEGIN_GEMM_Wmma_f16_gfx1200_DECS
1495- static constexpr size_t nInitParametersFp16GemmGfx1200 = 26 ;
1496- static const InitParamsAccel initParametersFp16GemmGfx1200[nInitParametersFp16GemmGfx1200];
1497- // END_GEMM_Wmma_f16_gfx1200_DECS
1498-
14991484// BEGIN_CONV_Wmma_f16_gfx1000_DECS
15001485static constexpr size_t nInitParametersFp16ConvGfx1000 = 26 ;
15011486static const InitParamsAccel initParametersFp16ConvGfx1000[nInitParametersFp16ConvGfx1000];
@@ -1551,11 +1536,6 @@ static constexpr size_t nInitParametersI8GemmGfx1100 = 9;
15511536static const InitParamsAccel initParametersI8GemmGfx1100[nInitParametersI8GemmGfx1100];
15521537// END_GEMM_Wmma_i8_gfx1100_DECS
15531538
1554- // BEGIN_GEMM_Wmma_i8_gfx1200_DECS
1555- static constexpr size_t nInitParametersI8GemmGfx1200 = 9 ;
1556- static const InitParamsAccel initParametersI8GemmGfx1200[nInitParametersI8GemmGfx1200];
1557- // END_GEMM_Wmma_i8_gfx1200_DECS
1558-
15591539// BEGIN_CONV_Wmma_i8_gfx1000_DECS
15601540static constexpr size_t nInitParametersForwardI8ConvGfx1000 = 11 ;
15611541static const InitParamsAccel initParametersForwardI8ConvGfx1000[nInitParametersForwardI8ConvGfx1000];
@@ -1571,16 +1551,26 @@ static constexpr size_t nInitParametersForwardI8ConvGfx1200 = 19;
15711551static const InitParamsAccel initParametersForwardI8ConvGfx1200[nInitParametersForwardI8ConvGfx1200];
15721552// END_CONV_Wmma_i8_gfx1200_DECS
15731553
1554+ // BEGIN_GEMM_Wmma_i8_gfx1201_DECS
1555+ static constexpr size_t nInitParametersI8GemmGfx1201 = 13 ;
1556+ static const InitParamsAccel initParametersI8GemmGfx1201[nInitParametersI8GemmGfx1201];
1557+ // END_GEMM_Wmma_i8_gfx1201_DECS
1558+
1559+ // BEGIN_GEMM_Wmma_f16_gfx1201_DECS
1560+ static constexpr size_t nInitParametersFp16GemmGfx1201 = 14 ;
1561+ static const InitParamsAccel initParametersFp16GemmGfx1201[nInitParametersFp16GemmGfx1201];
1562+ // END_GEMM_Wmma_f16_gfx1201_DECS
1563+
15741564#endif
15751565
15761566#ifdef NonAccel_LOOKUP_TABLE_GEN
15771567
15781568{" gfx1000_gemm_f32" , {PopulateParams::initParametersGemmGfx1000, PopulateParams::nInitParametersGemmGfx1000}},
15791569{" gfx1100_gemm_f32" , {PopulateParams::initParametersGemmGfx1100, PopulateParams::nInitParametersGemmGfx1100}},
1580- {" gfx1200_gemm_f32" , {PopulateParams::initParametersGemmGfx1200, PopulateParams::nInitParametersGemmGfx1200}},
15811570{" gfx1000_conv_f32" , {PopulateParams::initParametersConvGfx1000, PopulateParams::nInitParametersConvGfx1000}},
15821571{" gfx1100_conv_f32" , {PopulateParams::initParametersConvGfx1100, PopulateParams::nInitParametersConvGfx1100}},
15831572{" gfx1200_conv_f32" , {PopulateParams::initParametersConvGfx1200, PopulateParams::nInitParametersConvGfx1200}},
1573+ {" gfx1201_gemm_f32" , {PopulateParams::initParametersGemmGfx1201, PopulateParams::nInitParametersGemmGfx1201}},
15841574
15851575#endif
15861576
@@ -1620,7 +1610,6 @@ static const InitParamsAccel initParametersForwardI8ConvGfx1200[nInitParametersF
16201610{" gfx950_conv_i8" , {PopulateParamsXDL::initParametersForwardI8ConvGfx950, PopulateParamsXDL::nInitParametersForwardI8ConvGfx950}},
16211611{" gfx1000_gemm_f16" , {PopulateParamsWmma::initParametersFp16GemmGfx1000, PopulateParamsWmma::nInitParametersFp16GemmGfx1000}},
16221612{" gfx1100_gemm_f16" , {PopulateParamsWmma::initParametersFp16GemmGfx1100, PopulateParamsWmma::nInitParametersFp16GemmGfx1100}},
1623- {" gfx1200_gemm_f16" , {PopulateParamsWmma::initParametersFp16GemmGfx1200, PopulateParamsWmma::nInitParametersFp16GemmGfx1200}},
16241613{" gfx1000_conv_f16" , {PopulateParamsWmma::initParametersFp16ConvGfx1000, PopulateParamsWmma::nInitParametersFp16ConvGfx1000}},
16251614{" gfx1100_conv_f16" , {PopulateParamsWmma::initParametersFp16ConvGfx1100, PopulateParamsWmma::nInitParametersFp16ConvGfx1100}},
16261615{" gfx1200_conv_f16" , {PopulateParamsWmma::initParametersFp16ConvGfx1200, PopulateParamsWmma::nInitParametersFp16ConvGfx1200}},
@@ -1632,9 +1621,10 @@ static const InitParamsAccel initParametersForwardI8ConvGfx1200[nInitParametersF
16321621{" gfx1200_conv_fp8" , {PopulateParamsWmma::initParametersForwardFp8ConvGfx1200, PopulateParamsWmma::nInitParametersForwardFp8ConvGfx1200}},
16331622{" gfx1000_gemm_i8" , {PopulateParamsWmma::initParametersI8GemmGfx1000, PopulateParamsWmma::nInitParametersI8GemmGfx1000}},
16341623{" gfx1100_gemm_i8" , {PopulateParamsWmma::initParametersI8GemmGfx1100, PopulateParamsWmma::nInitParametersI8GemmGfx1100}},
1635- {" gfx1200_gemm_i8" , {PopulateParamsWmma::initParametersI8GemmGfx1200, PopulateParamsWmma::nInitParametersI8GemmGfx1200}},
16361624{" gfx1000_conv_i8" , {PopulateParamsWmma::initParametersForwardI8ConvGfx1000, PopulateParamsWmma::nInitParametersForwardI8ConvGfx1000}},
16371625{" gfx1100_conv_i8" , {PopulateParamsWmma::initParametersForwardI8ConvGfx1100, PopulateParamsWmma::nInitParametersForwardI8ConvGfx1100}},
16381626{" gfx1200_conv_i8" , {PopulateParamsWmma::initParametersForwardI8ConvGfx1200, PopulateParamsWmma::nInitParametersForwardI8ConvGfx1200}},
1627+ {" gfx1201_gemm_i8" , {PopulateParamsWmma::initParametersI8GemmGfx1201, PopulateParamsWmma::nInitParametersI8GemmGfx1201}},
1628+ {" gfx1201_gemm_f16" , {PopulateParamsWmma::initParametersFp16GemmGfx1201, PopulateParamsWmma::nInitParametersFp16GemmGfx1201}},
16391629
16401630#endif
0 commit comments