shader_recompiler: GetSrc as float by default except when explicit

This commit is contained in:
Vinicius Rangel 2024-07-30 23:08:49 -03:00
parent a7c9bfa5c5
commit 501bc704bf
No known key found for this signature in database
GPG Key ID: A5B154D904B761D9
4 changed files with 158 additions and 158 deletions

View File

@ -110,12 +110,12 @@ void Translator::S_MOVK(const GcnInst& inst) {
void Translator::S_ADDK_I32(const GcnInst& inst) { void Translator::S_ADDK_I32(const GcnInst& inst) {
const s32 simm16 = inst.control.sopk.simm; const s32 simm16 = inst.control.sopk.simm;
SetDst(inst.dst[0], ir.IAdd(GetSrc(inst.dst[0]), ir.Imm32(simm16))); SetDst(inst.dst[0], ir.IAdd(GetSrc(inst.dst[0], true), ir.Imm32(simm16)));
} }
void Translator::S_MULK_I32(const GcnInst& inst) { void Translator::S_MULK_I32(const GcnInst& inst) {
const s32 simm16 = inst.control.sopk.simm; const s32 simm16 = inst.control.sopk.simm;
SetDst(inst.dst[0], ir.IMul(GetSrc(inst.dst[0]), ir.Imm32(simm16))); SetDst(inst.dst[0], ir.IMul(GetSrc(inst.dst[0], true), ir.Imm32(simm16)));
} }
void Translator::S_MOV(const GcnInst& inst) { void Translator::S_MOV(const GcnInst& inst) {
@ -123,12 +123,12 @@ void Translator::S_MOV(const GcnInst& inst) {
} }
void Translator::S_MUL_I32(const GcnInst& inst) { void Translator::S_MUL_I32(const GcnInst& inst) {
SetDst(inst.dst[0], ir.IMul(GetSrc(inst.src[0]), GetSrc(inst.src[1]))); SetDst(inst.dst[0], ir.IMul(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true)));
} }
void Translator::S_CMP(ConditionOp cond, bool is_signed, const GcnInst& inst) { void Translator::S_CMP(ConditionOp cond, bool is_signed, const GcnInst& inst) {
const IR::U32 lhs = GetSrc(inst.src[0]); const IR::U32 lhs = GetSrc(inst.src[0], true);
const IR::U32 rhs = GetSrc(inst.src[1]); const IR::U32 rhs = GetSrc(inst.src[1], true);
const IR::U1 result = [&] { const IR::U1 result = [&] {
switch (cond) { switch (cond) {
case ConditionOp::EQ: case ConditionOp::EQ:
@ -288,47 +288,47 @@ void Translator::S_AND_B64(NegateMode negate, const GcnInst& inst) {
} }
void Translator::S_ADD_I32(const GcnInst& inst) { void Translator::S_ADD_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IAdd(src0, src1)); SetDst(inst.dst[0], ir.IAdd(src0, src1));
// TODO: Overflow flag // TODO: Overflow flag
} }
void Translator::S_AND_B32(const GcnInst& inst) { void Translator::S_AND_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result{ir.BitwiseAnd(src0, src1)}; const IR::U32 result{ir.BitwiseAnd(src0, src1)};
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.INotEqual(result, ir.Imm32(0))); ir.SetScc(ir.INotEqual(result, ir.Imm32(0)));
} }
void Translator::S_ASHR_I32(const GcnInst& inst) { void Translator::S_ASHR_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result{ir.ShiftRightArithmetic(src0, src1)}; const IR::U32 result{ir.ShiftRightArithmetic(src0, src1)};
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.INotEqual(result, ir.Imm32(0))); ir.SetScc(ir.INotEqual(result, ir.Imm32(0)));
} }
void Translator::S_OR_B32(const GcnInst& inst) { void Translator::S_OR_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result{ir.BitwiseOr(src0, src1)}; const IR::U32 result{ir.BitwiseOr(src0, src1)};
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.INotEqual(result, ir.Imm32(0))); ir.SetScc(ir.INotEqual(result, ir.Imm32(0)));
} }
void Translator::S_LSHR_B32(const GcnInst& inst) { void Translator::S_LSHR_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result{ir.ShiftRightLogical(src0, src1)}; const IR::U32 result{ir.ShiftRightLogical(src0, src1)};
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.INotEqual(result, ir.Imm32(0))); ir.SetScc(ir.INotEqual(result, ir.Imm32(0)));
} }
void Translator::S_CSELECT_B32(const GcnInst& inst) { void Translator::S_CSELECT_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], IR::U32{ir.Select(ir.GetScc(), src0, src1)}); SetDst(inst.dst[0], IR::U32{ir.Select(ir.GetScc(), src0, src1)});
} }
@ -363,8 +363,8 @@ void Translator::S_CSELECT_B64(const GcnInst& inst) {
} }
void Translator::S_BFE_U32(const GcnInst& inst) { void Translator::S_BFE_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 offset{ir.BitwiseAnd(src1, ir.Imm32(0x1F))}; const IR::U32 offset{ir.BitwiseAnd(src1, ir.Imm32(0x1F))};
const IR::U32 count{ir.BitFieldExtract(src1, ir.Imm32(16), ir.Imm32(7))}; const IR::U32 count{ir.BitFieldExtract(src1, ir.Imm32(16), ir.Imm32(7))};
const IR::U32 result{ir.BitFieldExtract(src0, offset, count)}; const IR::U32 result{ir.BitFieldExtract(src0, offset, count)};
@ -373,16 +373,16 @@ void Translator::S_BFE_U32(const GcnInst& inst) {
} }
void Translator::S_LSHL_B32(const GcnInst& inst) { void Translator::S_LSHL_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result = ir.ShiftLeftLogical(src0, ir.BitwiseAnd(src1, ir.Imm32(0x1F))); const IR::U32 result = ir.ShiftLeftLogical(src0, ir.BitwiseAnd(src1, ir.Imm32(0x1F)));
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.INotEqual(result, ir.Imm32(0))); ir.SetScc(ir.INotEqual(result, ir.Imm32(0)));
} }
void Translator::S_BFM_B32(const GcnInst& inst) { void Translator::S_BFM_B32(const GcnInst& inst) {
const IR::U32 src0{ir.BitwiseAnd(GetSrc(inst.src[0]), ir.Imm32(0x1F))}; const IR::U32 src0{ir.BitwiseAnd(GetSrc(inst.src[0], true), ir.Imm32(0x1F))};
const IR::U32 src1{ir.BitwiseAnd(GetSrc(inst.src[1]), ir.Imm32(0x1F))}; const IR::U32 src1{ir.BitwiseAnd(GetSrc(inst.src[1], true), ir.Imm32(0x1F))};
const IR::U32 mask{ir.ISub(ir.ShiftLeftLogical(ir.Imm32(1u), src0), ir.Imm32(1))}; const IR::U32 mask{ir.ISub(ir.ShiftLeftLogical(ir.Imm32(1u), src0), ir.Imm32(1))};
SetDst(inst.dst[0], ir.ShiftLeftLogical(mask, src1)); SetDst(inst.dst[0], ir.ShiftLeftLogical(mask, src1));
} }
@ -420,16 +420,16 @@ void Translator::S_BREV_B32(const GcnInst& inst) {
} }
void Translator::S_ADD_U32(const GcnInst& inst) { void Translator::S_ADD_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IAdd(src0, src1)); SetDst(inst.dst[0], ir.IAdd(src0, src1));
// TODO: Carry out // TODO: Carry out
ir.SetScc(ir.Imm1(false)); ir.SetScc(ir.Imm1(false));
} }
void Translator::S_SUB_U32(const GcnInst& inst) { void Translator::S_SUB_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ISub(src0, src1)); SetDst(inst.dst[0], ir.ISub(src0, src1));
// TODO: Carry out // TODO: Carry out
ir.SetScc(ir.Imm1(false)); ir.SetScc(ir.Imm1(false));
@ -442,22 +442,22 @@ void Translator::S_GETPC_B64(u32 pc, const GcnInst& inst) {
} }
void Translator::S_ADDC_U32(const GcnInst& inst) { void Translator::S_ADDC_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IAdd(ir.IAdd(src0, src1), ir.GetSccLo())); SetDst(inst.dst[0], ir.IAdd(ir.IAdd(src0, src1), ir.GetSccLo()));
} }
void Translator::S_MAX_U32(const GcnInst& inst) { void Translator::S_MAX_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result = ir.UMax(src0, src1); const IR::U32 result = ir.UMax(src0, src1);
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.IEqual(result, src0)); ir.SetScc(ir.IEqual(result, src0));
} }
void Translator::S_MIN_U32(const GcnInst& inst) { void Translator::S_MIN_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 result = ir.UMin(src0, src1); const IR::U32 result = ir.UMin(src0, src1);
SetDst(inst.dst[0], result); SetDst(inst.dst[0], result);
ir.SetScc(ir.IEqual(result, src0)); ir.SetScc(ir.IEqual(result, src0));

View File

@ -74,20 +74,21 @@ void Translator::EmitPrologue() {
} }
template <> template <>
IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool force_flt) { IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool integer) {
IR::U32F32 value{}; IR::U32F32 value{};
const bool is_float = operand.type == ScalarType::Float32 || force_flt; const bool is_float = operand.type == ScalarType::Float32 && !integer;
switch (operand.field) { switch (operand.field) {
case OperandField::ScalarGPR: case OperandField::ScalarGPR:
if (is_float) { if (!integer) {
value = ir.GetScalarReg<IR::F32>(IR::ScalarReg(operand.code)); value = ir.GetScalarReg<IR::F32>(IR::ScalarReg(operand.code));
} else { } else {
value = ir.GetScalarReg<IR::U32>(IR::ScalarReg(operand.code)); value = ir.GetScalarReg<IR::U32>(IR::ScalarReg(operand.code));
} }
break; break;
case OperandField::VectorGPR: case OperandField::VectorGPR:
if (is_float) { if (!integer) {
value = ir.GetVectorReg<IR::F32>(IR::VectorReg(operand.code)); value = ir.GetVectorReg<IR::F32>(IR::VectorReg(operand.code));
} else { } else {
value = ir.GetVectorReg<IR::U32>(IR::VectorReg(operand.code)); value = ir.GetVectorReg<IR::U32>(IR::VectorReg(operand.code));
@ -101,11 +102,11 @@ IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool force_flt) {
} }
break; break;
case OperandField::SignedConstIntPos: case OperandField::SignedConstIntPos:
ASSERT(!force_flt); ASSERT(!is_float);
value = ir.Imm32(operand.code - SignedConstIntPosMin + 1); value = ir.Imm32(operand.code - SignedConstIntPosMin + 1);
break; break;
case OperandField::SignedConstIntNeg: case OperandField::SignedConstIntNeg:
ASSERT(!force_flt); ASSERT(!is_float);
value = ir.Imm32(-s32(operand.code) + SignedConstIntNegMin - 1); value = ir.Imm32(-s32(operand.code) + SignedConstIntNegMin - 1);
break; break;
case OperandField::LiteralConst: case OperandField::LiteralConst:
@ -148,14 +149,14 @@ IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool force_flt) {
value = ir.Imm32(-4.0f); value = ir.Imm32(-4.0f);
break; break;
case OperandField::VccLo: case OperandField::VccLo:
if (force_flt) { if (is_float) {
value = ir.BitCast<IR::F32>(ir.GetVccLo()); value = ir.BitCast<IR::F32>(ir.GetVccLo());
} else { } else {
value = ir.GetVccLo(); value = ir.GetVccLo();
} }
break; break;
case OperandField::VccHi: case OperandField::VccHi:
if (force_flt) { if (is_float) {
value = ir.BitCast<IR::F32>(ir.GetVccHi()); value = ir.BitCast<IR::F32>(ir.GetVccHi());
} else { } else {
value = ir.GetVccHi(); value = ir.GetVccHi();
@ -167,7 +168,7 @@ IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool force_flt) {
UNREACHABLE(); UNREACHABLE();
} }
if (is_float) { if (!integer) {
if (operand.input_modifier.abs) { if (operand.input_modifier.abs) {
value = ir.FPAbs(value); value = ir.FPAbs(value);
} }
@ -175,17 +176,18 @@ IR::U32F32 Translator::GetSrc(const InstOperand& operand, bool force_flt) {
value = ir.FPNeg(value); value = ir.FPNeg(value);
} }
} }
return value; return value;
} }
template <> template <>
IR::U32 Translator::GetSrc(const InstOperand& operand, bool force_flt) { IR::U32 Translator::GetSrc(const InstOperand& operand, bool) {
return GetSrc<IR::U32F32>(operand, force_flt); return GetSrc<IR::U32F32>(operand, true);
} }
template <> template <>
IR::F32 Translator::GetSrc(const InstOperand& operand, bool) { IR::F32 Translator::GetSrc(const InstOperand& operand, bool integer) {
return GetSrc<IR::U32F32>(operand, true); return GetSrc<IR::U32F32>(operand, integer);
} }
template <> template <>

View File

@ -210,7 +210,7 @@ public:
private: private:
template <typename T = IR::U32F32> template <typename T = IR::U32F32>
[[nodiscard]] T GetSrc(const InstOperand& operand, bool flt_zero = false); [[nodiscard]] T GetSrc(const InstOperand& operand, bool integer = false);
template <typename T = IR::U64F64> template <typename T = IR::U64F64>
[[nodiscard]] T GetSrc64(const InstOperand& operand, bool flt_zero = false); [[nodiscard]] T GetSrc64(const InstOperand& operand, bool flt_zero = false);
void SetDst(const InstOperand& operand, const IR::U32F32& value); void SetDst(const InstOperand& operand, const IR::U32F32& value);

View File

@ -312,19 +312,17 @@ void Translator::V_MOV(const GcnInst& inst) {
} }
void Translator::V_SAD(const GcnInst& inst) { void Translator::V_SAD(const GcnInst& inst) {
const IR::U32 abs_diff = ir.IAbs(ir.ISub(GetSrc(inst.src[0]), GetSrc(inst.src[1]))); const IR::U32 abs_diff = ir.IAbs(ir.ISub(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true)));
SetDst(inst.dst[0], ir.IAdd(abs_diff, GetSrc(inst.src[2]))); SetDst(inst.dst[0], ir.IAdd(abs_diff, GetSrc(inst.src[2])));
} }
void Translator::V_MAC_F32(const GcnInst& inst) { void Translator::V_MAC_F32(const GcnInst& inst) {
SetDst(inst.dst[0], ir.FPFma(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true), SetDst(inst.dst[0], ir.FPFma(GetSrc(inst.src[0]), GetSrc(inst.src[1]), GetSrc(inst.dst[0])));
GetSrc(inst.dst[0], true)));
} }
void Translator::V_CVT_PKRTZ_F16_F32(const GcnInst& inst) { void Translator::V_CVT_PKRTZ_F16_F32(const GcnInst& inst) {
const IR::VectorReg dst_reg{inst.dst[0].code}; const IR::VectorReg dst_reg{inst.dst[0].code};
const IR::Value vec_f32 = const IR::Value vec_f32 = ir.CompositeConstruct(GetSrc(inst.src[0]), GetSrc(inst.src[1]));
ir.CompositeConstruct(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true));
ir.SetVectorReg(dst_reg, ir.PackHalf2x16(vec_f32)); ir.SetVectorReg(dst_reg, ir.PackHalf2x16(vec_f32));
} }
@ -335,13 +333,13 @@ void Translator::V_CVT_F32_F16(const GcnInst& inst) {
} }
void Translator::V_CVT_F16_F32(const GcnInst& inst) { void Translator::V_CVT_F16_F32(const GcnInst& inst) {
const IR::F32 src0 = GetSrc(inst.src[0], true); const IR::F32 src0 = GetSrc(inst.src[0]);
const IR::F16 src0fp16 = ir.FPConvert(16, src0); const IR::F16 src0fp16 = ir.FPConvert(16, src0);
SetDst(inst.dst[0], ir.UConvert(32, ir.BitCast<IR::U16>(src0fp16))); SetDst(inst.dst[0], ir.UConvert(32, ir.BitCast<IR::U16>(src0fp16)));
} }
void Translator::V_MUL_F32(const GcnInst& inst) { void Translator::V_MUL_F32(const GcnInst& inst) {
SetDst(inst.dst[0], ir.FPMul(GetSrc(inst.src[0], true), GetSrc(inst.src[1], true))); SetDst(inst.dst[0], ir.FPMul(GetSrc(inst.src[0]), GetSrc(inst.src[1])));
} }
void Translator::V_CNDMASK_B32(const GcnInst& inst) { void Translator::V_CNDMASK_B32(const GcnInst& inst) {
@ -387,21 +385,21 @@ void Translator::V_AND_B32(const GcnInst& inst) {
} }
void Translator::V_LSHLREV_B32(const GcnInst& inst) { void Translator::V_LSHLREV_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::VectorReg dst_reg{inst.dst[0].code}; const IR::VectorReg dst_reg{inst.dst[0].code};
ir.SetVectorReg(dst_reg, ir.ShiftLeftLogical(src1, ir.BitwiseAnd(src0, ir.Imm32(0x1F)))); ir.SetVectorReg(dst_reg, ir.ShiftLeftLogical(src1, ir.BitwiseAnd(src0, ir.Imm32(0x1F))));
} }
void Translator::V_LSHL_B32(const GcnInst& inst) { void Translator::V_LSHL_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ShiftLeftLogical(src0, ir.BitwiseAnd(src1, ir.Imm32(0x1F)))); SetDst(inst.dst[0], ir.ShiftLeftLogical(src0, ir.BitwiseAnd(src1, ir.Imm32(0x1F))));
} }
void Translator::V_ADD_I32(const GcnInst& inst) { void Translator::V_ADD_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{ir.GetVectorReg(IR::VectorReg(inst.src[1].code))}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::VectorReg dst_reg{inst.dst[0].code}; const IR::VectorReg dst_reg{inst.dst[0].code};
ir.SetVectorReg(dst_reg, ir.IAdd(src0, src1)); ir.SetVectorReg(dst_reg, ir.IAdd(src0, src1));
// TODO: Carry // TODO: Carry
@ -409,8 +407,8 @@ void Translator::V_ADD_I32(const GcnInst& inst) {
void Translator::V_ADDC_U32(const GcnInst& inst) { void Translator::V_ADDC_U32(const GcnInst& inst) {
const auto src0 = GetSrc<IR::U32>(inst.src[0]); const auto src0 = GetSrc<IR::U32>(inst.src[0], true);
const auto src1 = GetSrc<IR::U32>(inst.src[1]); const auto src1 = GetSrc<IR::U32>(inst.src[1], true);
IR::U32 scarry; IR::U32 scarry;
if (inst.src_count == 3) { // VOP3 if (inst.src_count == 3) { // VOP3
@ -444,21 +442,21 @@ void Translator::V_CVT_F32_U32(const GcnInst& inst) {
} }
void Translator::V_MAD_F32(const GcnInst& inst) { void Translator::V_MAD_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::F32 src2{GetSrc(inst.src[2], true)}; const IR::F32 src2{GetSrc(inst.src[2])};
SetDst(inst.dst[0], ir.FPFma(src0, src1, src2)); SetDst(inst.dst[0], ir.FPFma(src0, src1, src2));
} }
void Translator::V_FRACT_F32(const GcnInst& inst) { void Translator::V_FRACT_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::VectorReg dst_reg{inst.dst[0].code}; const IR::VectorReg dst_reg{inst.dst[0].code};
ir.SetVectorReg(dst_reg, ir.Fract(src0)); ir.SetVectorReg(dst_reg, ir.Fract(src0));
} }
void Translator::V_ADD_F32(const GcnInst& inst) { void Translator::V_ADD_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
SetDst(inst.dst[0], ir.FPAdd(src0, src1)); SetDst(inst.dst[0], ir.FPAdd(src0, src1));
} }
@ -472,40 +470,40 @@ void Translator::V_CVT_OFF_F32_I4(const GcnInst& inst) {
} }
void Translator::V_MED3_F32(const GcnInst& inst) { void Translator::V_MED3_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::F32 src2{GetSrc(inst.src[2], true)}; const IR::F32 src2{GetSrc(inst.src[2])};
const IR::F32 mmx = ir.FPMin(ir.FPMax(src0, src1), src2); const IR::F32 mmx = ir.FPMin(ir.FPMax(src0, src1), src2);
SetDst(inst.dst[0], ir.FPMax(ir.FPMin(src0, src1), mmx)); SetDst(inst.dst[0], ir.FPMax(ir.FPMin(src0, src1), mmx));
} }
void Translator::V_FLOOR_F32(const GcnInst& inst) { void Translator::V_FLOOR_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::VectorReg dst_reg{inst.dst[0].code}; const IR::VectorReg dst_reg{inst.dst[0].code};
ir.SetVectorReg(dst_reg, ir.FPFloor(src0)); ir.SetVectorReg(dst_reg, ir.FPFloor(src0));
} }
void Translator::V_SUB_F32(const GcnInst& inst) { void Translator::V_SUB_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
SetDst(inst.dst[0], ir.FPSub(src0, src1)); SetDst(inst.dst[0], ir.FPSub(src0, src1));
} }
void Translator::V_RCP_F32(const GcnInst& inst) { void Translator::V_RCP_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPRecip(src0)); SetDst(inst.dst[0], ir.FPRecip(src0));
} }
void Translator::V_FMA_F32(const GcnInst& inst) { void Translator::V_FMA_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::F32 src2{GetSrc(inst.src[2], true)}; const IR::F32 src2{GetSrc(inst.src[2])};
SetDst(inst.dst[0], ir.FPFma(src0, src1, src2)); SetDst(inst.dst[0], ir.FPFma(src0, src1, src2));
} }
void Translator::V_CMP_F32(ConditionOp op, bool set_exec, const GcnInst& inst) { void Translator::V_CMP_F32(ConditionOp op, bool set_exec, const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::U1 result = [&] { const IR::U1 result = [&] {
switch (op) { switch (op) {
case ConditionOp::F: case ConditionOp::F:
@ -545,66 +543,66 @@ void Translator::V_CMP_F32(ConditionOp op, bool set_exec, const GcnInst& inst) {
} }
void Translator::V_MAX_F32(const GcnInst& inst, bool is_legacy) { void Translator::V_MAX_F32(const GcnInst& inst, bool is_legacy) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
SetDst(inst.dst[0], ir.FPMax(src0, src1, is_legacy)); SetDst(inst.dst[0], ir.FPMax(src0, src1, is_legacy));
} }
void Translator::V_MAX_U32(bool is_signed, const GcnInst& inst) { void Translator::V_MAX_U32(bool is_signed, const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IMax(src0, src1, is_signed)); SetDst(inst.dst[0], ir.IMax(src0, src1, is_signed));
} }
void Translator::V_RSQ_F32(const GcnInst& inst) { void Translator::V_RSQ_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPRecipSqrt(src0)); SetDst(inst.dst[0], ir.FPRecipSqrt(src0));
} }
void Translator::V_SIN_F32(const GcnInst& inst) { void Translator::V_SIN_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPSin(src0)); SetDst(inst.dst[0], ir.FPSin(src0));
} }
void Translator::V_LOG_F32(const GcnInst& inst) { void Translator::V_LOG_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPLog2(src0)); SetDst(inst.dst[0], ir.FPLog2(src0));
} }
void Translator::V_EXP_F32(const GcnInst& inst) { void Translator::V_EXP_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPExp2(src0)); SetDst(inst.dst[0], ir.FPExp2(src0));
} }
void Translator::V_SQRT_F32(const GcnInst& inst) { void Translator::V_SQRT_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPSqrt(src0)); SetDst(inst.dst[0], ir.FPSqrt(src0));
} }
void Translator::V_MIN_F32(const GcnInst& inst, bool is_legacy) { void Translator::V_MIN_F32(const GcnInst& inst, bool is_legacy) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
SetDst(inst.dst[0], ir.FPMin(src0, src1, is_legacy)); SetDst(inst.dst[0], ir.FPMin(src0, src1, is_legacy));
} }
void Translator::V_MIN3_F32(const GcnInst& inst) { void Translator::V_MIN3_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::F32 src2{GetSrc(inst.src[2], true)}; const IR::F32 src2{GetSrc(inst.src[2])};
SetDst(inst.dst[0], ir.FPMin(src0, ir.FPMin(src1, src2))); SetDst(inst.dst[0], ir.FPMin(src0, ir.FPMin(src1, src2)));
} }
void Translator::V_MIN3_I32(const GcnInst& inst) { void Translator::V_MIN3_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 src2{GetSrc(inst.src[2])}; const IR::U32 src2{GetSrc(inst.src[2], true)};
SetDst(inst.dst[0], ir.SMin(src0, ir.SMin(src1, src2))); SetDst(inst.dst[0], ir.SMin(src0, ir.SMin(src1, src2)));
} }
void Translator::V_MADMK_F32(const GcnInst& inst) { void Translator::V_MADMK_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::F32 k{GetSrc(inst.src[2], true)}; const IR::F32 k{GetSrc(inst.src[2])};
SetDst(inst.dst[0], ir.FPFma(src0, k, src1)); SetDst(inst.dst[0], ir.FPFma(src0, k, src1));
} }
@ -613,39 +611,39 @@ void Translator::V_CUBEMA_F32(const GcnInst& inst) {
} }
void Translator::V_CUBESC_F32(const GcnInst& inst) { void Translator::V_CUBESC_F32(const GcnInst& inst) {
SetDst(inst.dst[0], GetSrc(inst.src[0], true)); SetDst(inst.dst[0], GetSrc(inst.src[0]));
} }
void Translator::V_CUBETC_F32(const GcnInst& inst) { void Translator::V_CUBETC_F32(const GcnInst& inst) {
SetDst(inst.dst[0], GetSrc(inst.src[1], true)); SetDst(inst.dst[0], GetSrc(inst.src[1]));
} }
void Translator::V_CUBEID_F32(const GcnInst& inst) { void Translator::V_CUBEID_F32(const GcnInst& inst) {
SetDst(inst.dst[0], GetSrc(inst.src[2], true)); SetDst(inst.dst[0], GetSrc(inst.src[2]));
} }
void Translator::V_CVT_U32_F32(const GcnInst& inst) { void Translator::V_CVT_U32_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.ConvertFToU(32, src0)); SetDst(inst.dst[0], ir.ConvertFToU(32, src0));
} }
void Translator::V_SUBREV_F32(const GcnInst& inst) { void Translator::V_SUBREV_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
SetDst(inst.dst[0], ir.FPSub(src1, src0)); SetDst(inst.dst[0], ir.FPSub(src1, src0));
} }
void Translator::V_SUBREV_I32(const GcnInst& inst) { void Translator::V_SUBREV_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ISub(src1, src0)); SetDst(inst.dst[0], ir.ISub(src1, src0));
// TODO: Carry-out // TODO: Carry-out
} }
void Translator::V_MAD_U64_U32(const GcnInst& inst) { void Translator::V_MAD_U64_U32(const GcnInst& inst) {
const auto src0 = GetSrc<IR::U32>(inst.src[0]); const auto src0 = GetSrc<IR::U32>(inst.src[0], true);
const auto src1 = GetSrc<IR::U32>(inst.src[1]); const auto src1 = GetSrc<IR::U32>(inst.src[1], true);
const auto src2 = GetSrc64<IR::U64>(inst.src[2]); const auto src2 = GetSrc64<IR::U64>(inst.src[2], true);
// const IR::U64 mul_result = ir.UConvert(64, ir.IMul(src0, src1)); // const IR::U64 mul_result = ir.UConvert(64, ir.IMul(src0, src1));
const IR::U64 mul_result = const IR::U64 mul_result =
@ -661,8 +659,8 @@ void Translator::V_MAD_U64_U32(const GcnInst& inst) {
} }
void Translator::V_CMP_U32(ConditionOp op, bool is_signed, bool set_exec, const GcnInst& inst) { void Translator::V_CMP_U32(ConditionOp op, bool is_signed, bool set_exec, const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U1 result = [&] { const IR::U1 result = [&] {
switch (op) { switch (op) {
case ConditionOp::F: case ConditionOp::F:
@ -699,64 +697,64 @@ void Translator::V_CMP_U32(ConditionOp op, bool is_signed, bool set_exec, const
} }
void Translator::V_LSHRREV_B32(const GcnInst& inst) { void Translator::V_LSHRREV_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ShiftRightLogical(src1, ir.BitwiseAnd(src0, ir.Imm32(0x1F)))); SetDst(inst.dst[0], ir.ShiftRightLogical(src1, ir.BitwiseAnd(src0, ir.Imm32(0x1F))));
} }
void Translator::V_MUL_HI_U32(bool is_signed, const GcnInst& inst) { void Translator::V_MUL_HI_U32(bool is_signed, const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 hi{ir.CompositeExtract(ir.IMulExt(src0, src1, is_signed), 1)}; const IR::U32 hi{ir.CompositeExtract(ir.IMulExt(src0, src1, is_signed), 1)};
SetDst(inst.dst[0], hi); SetDst(inst.dst[0], hi);
} }
void Translator::V_SAD_U32(const GcnInst& inst) { void Translator::V_SAD_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 src2{GetSrc(inst.src[2])}; const IR::U32 src2{GetSrc(inst.src[2], true)};
const IR::U32 max{ir.IMax(src0, src1, false)}; const IR::U32 max{ir.IMax(src0, src1, false)};
const IR::U32 min{ir.IMin(src0, src1, false)}; const IR::U32 min{ir.IMin(src0, src1, false)};
SetDst(inst.dst[0], ir.IAdd(ir.ISub(max, min), src2)); SetDst(inst.dst[0], ir.IAdd(ir.ISub(max, min), src2));
} }
void Translator::V_BFE_U32(bool is_signed, const GcnInst& inst) { void Translator::V_BFE_U32(bool is_signed, const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{ir.BitwiseAnd(GetSrc(inst.src[1]), ir.Imm32(0x1F))}; const IR::U32 src1{ir.BitwiseAnd(GetSrc(inst.src[1], true), ir.Imm32(0x1F))};
const IR::U32 src2{ir.BitwiseAnd(GetSrc(inst.src[2]), ir.Imm32(0x1F))}; const IR::U32 src2{ir.BitwiseAnd(GetSrc(inst.src[2], true), ir.Imm32(0x1F))};
SetDst(inst.dst[0], ir.BitFieldExtract(src0, src1, src2, is_signed)); SetDst(inst.dst[0], ir.BitFieldExtract(src0, src1, src2, is_signed));
} }
void Translator::V_MAD_I32_I24(const GcnInst& inst, bool is_signed) { void Translator::V_MAD_I32_I24(const GcnInst& inst, bool is_signed) {
const IR::U32 src0{ const IR::U32 src0{
ir.BitFieldExtract(GetSrc(inst.src[0]), ir.Imm32(0), ir.Imm32(24), is_signed)}; ir.BitFieldExtract(GetSrc(inst.src[0], true), ir.Imm32(0), ir.Imm32(24), is_signed)};
const IR::U32 src1{ const IR::U32 src1{
ir.BitFieldExtract(GetSrc(inst.src[1]), ir.Imm32(0), ir.Imm32(24), is_signed)}; ir.BitFieldExtract(GetSrc(inst.src[1], true), ir.Imm32(0), ir.Imm32(24), is_signed)};
const IR::U32 src2{GetSrc(inst.src[2])}; const IR::U32 src2{GetSrc(inst.src[2], true)};
SetDst(inst.dst[0], ir.IAdd(ir.IMul(src0, src1), src2)); SetDst(inst.dst[0], ir.IAdd(ir.IMul(src0, src1), src2));
} }
void Translator::V_MUL_I32_I24(const GcnInst& inst) { void Translator::V_MUL_I32_I24(const GcnInst& inst) {
const IR::U32 src0{ir.BitFieldExtract(GetSrc(inst.src[0]), ir.Imm32(0), ir.Imm32(24), true)}; const IR::U32 src0{ir.BitFieldExtract(GetSrc(inst.src[0], true), ir.Imm32(0), ir.Imm32(24))};
const IR::U32 src1{ir.BitFieldExtract(GetSrc(inst.src[1]), ir.Imm32(0), ir.Imm32(24), true)}; const IR::U32 src1{ir.BitFieldExtract(GetSrc(inst.src[1], true), ir.Imm32(0), ir.Imm32(24))};
SetDst(inst.dst[0], ir.IMul(src0, src1)); SetDst(inst.dst[0], ir.IMul(src0, src1));
} }
void Translator::V_SUB_I32(const GcnInst& inst) { void Translator::V_SUB_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ISub(src0, src1)); SetDst(inst.dst[0], ir.ISub(src0, src1));
} }
void Translator::V_LSHR_B32(const GcnInst& inst) { void Translator::V_LSHR_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0])};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ShiftRightLogical(src0, ir.BitwiseAnd(src1, ir.Imm32(0x1F)))); SetDst(inst.dst[0], ir.ShiftRightLogical(src0, ir.BitwiseAnd(src1, ir.Imm32(0x1F))));
} }
void Translator::V_ASHRREV_I32(const GcnInst& inst) { void Translator::V_ASHRREV_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.ShiftRightArithmetic(src1, ir.BitwiseAnd(src0, ir.Imm32(0x1F)))); SetDst(inst.dst[0], ir.ShiftRightArithmetic(src1, ir.BitwiseAnd(src0, ir.Imm32(0x1F))));
} }
@ -765,65 +763,65 @@ void Translator::V_MAD_U32_U24(const GcnInst& inst) {
} }
void Translator::V_RNDNE_F32(const GcnInst& inst) { void Translator::V_RNDNE_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPRoundEven(src0)); SetDst(inst.dst[0], ir.FPRoundEven(src0));
} }
void Translator::V_BCNT_U32_B32(const GcnInst& inst) { void Translator::V_BCNT_U32_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IAdd(ir.BitCount(src0), src1)); SetDst(inst.dst[0], ir.IAdd(ir.BitCount(src0), src1));
} }
void Translator::V_COS_F32(const GcnInst& inst) { void Translator::V_COS_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPCos(src0)); SetDst(inst.dst[0], ir.FPCos(src0));
} }
void Translator::V_MAX3_F32(const GcnInst& inst) { void Translator::V_MAX3_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::F32 src1{GetSrc(inst.src[1], true)}; const IR::F32 src1{GetSrc(inst.src[1])};
const IR::F32 src2{GetSrc(inst.src[2], true)}; const IR::F32 src2{GetSrc(inst.src[2])};
SetDst(inst.dst[0], ir.FPMax(src0, ir.FPMax(src1, src2))); SetDst(inst.dst[0], ir.FPMax(src0, ir.FPMax(src1, src2)));
} }
void Translator::V_MAX3_U32(const GcnInst& inst) { void Translator::V_MAX3_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 src2{GetSrc(inst.src[2])}; const IR::U32 src2{GetSrc(inst.src[2], true)};
SetDst(inst.dst[0], ir.UMax(src0, ir.UMax(src1, src2))); SetDst(inst.dst[0], ir.UMax(src0, ir.UMax(src1, src2)));
} }
void Translator::V_CVT_I32_F32(const GcnInst& inst) { void Translator::V_CVT_I32_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.ConvertFToS(32, src0)); SetDst(inst.dst[0], ir.ConvertFToS(32, src0));
} }
void Translator::V_MIN_I32(const GcnInst& inst) { void Translator::V_MIN_I32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.SMin(src0, src1)); SetDst(inst.dst[0], ir.SMin(src0, src1));
} }
void Translator::V_MUL_LO_U32(const GcnInst& inst) { void Translator::V_MUL_LO_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IMul(src0, src1)); SetDst(inst.dst[0], ir.IMul(src0, src1));
} }
void Translator::V_TRUNC_F32(const GcnInst& inst) { void Translator::V_TRUNC_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPTrunc(src0)); SetDst(inst.dst[0], ir.FPTrunc(src0));
} }
void Translator::V_CEIL_F32(const GcnInst& inst) { void Translator::V_CEIL_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.FPCeil(src0)); SetDst(inst.dst[0], ir.FPCeil(src0));
} }
void Translator::V_MIN_U32(const GcnInst& inst) { void Translator::V_MIN_U32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
SetDst(inst.dst[0], ir.IMin(src0, src1, false)); SetDst(inst.dst[0], ir.IMin(src0, src1, false));
} }
@ -881,19 +879,19 @@ void Translator::V_BFREV_B32(const GcnInst& inst) {
} }
void Translator::V_LDEXP_F32(const GcnInst& inst) { void Translator::V_LDEXP_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1])};
SetDst(inst.dst[0], ir.FPLdexp(src0, src1)); SetDst(inst.dst[0], ir.FPLdexp(src0, src1));
} }
void Translator::V_CVT_FLR_I32_F32(const GcnInst& inst) { void Translator::V_CVT_FLR_I32_F32(const GcnInst& inst) {
const IR::F32 src0{GetSrc(inst.src[0], true)}; const IR::F32 src0{GetSrc(inst.src[0])};
SetDst(inst.dst[0], ir.ConvertFToI(32, true, ir.FPFloor(src0))); SetDst(inst.dst[0], ir.ConvertFToI(32, true, ir.FPFloor(src0)));
} }
void Translator::V_CMP_CLASS_F32(const GcnInst& inst) { void Translator::V_CMP_CLASS_F32(const GcnInst& inst) {
const IR::F32F64 src0{GetSrc(inst.src[0])}; const IR::F32F64 src0{GetSrc(inst.src[0])};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
IR::U1 value; IR::U1 value;
if (src1.IsImmediate()) { if (src1.IsImmediate()) {
const auto class_mask = static_cast<IR::FloatClassFunc>(src1.U32()); const auto class_mask = static_cast<IR::FloatClassFunc>(src1.U32());
@ -918,13 +916,13 @@ void Translator::V_CMP_CLASS_F32(const GcnInst& inst) {
} }
void Translator::V_FFBL_B32(const GcnInst& inst) { void Translator::V_FFBL_B32(const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
SetDst(inst.dst[0], ir.FindILsb(src0)); SetDst(inst.dst[0], ir.FindILsb(src0));
} }
void Translator::V_MBCNT_U32_B32(bool is_low, const GcnInst& inst) { void Translator::V_MBCNT_U32_B32(bool is_low, const GcnInst& inst) {
const IR::U32 src0{GetSrc(inst.src[0])}; const IR::U32 src0{GetSrc(inst.src[0], true)};
const IR::U32 src1{GetSrc(inst.src[1])}; const IR::U32 src1{GetSrc(inst.src[1], true)};
const IR::U32 lane_id = ir.LaneId(); const IR::U32 lane_id = ir.LaneId();
const auto [warp_half, mask_shift] = [&]() -> std::pair<IR::U32, IR::U32> { const auto [warp_half, mask_shift] = [&]() -> std::pair<IR::U32, IR::U32> {