pytorch/c10/test/util/bfloat16_test.cpp

#include <c10/util/BFloat16.h>
#include <gtest/gtest.h>

namespace {
  float float_from_bytes(
      uint32_t sign,
      uint32_t exponent,
      uint32_t fraction
  ) {
      uint32_t bytes;
      bytes = 0;
      bytes |= sign;
      bytes <<= 8;
      bytes |= exponent;
      bytes <<= 23;
      bytes |= fraction;

      float res;
      std::memcpy(&res, &bytes, sizeof(res));
      return res;
  }

  TEST(BFloat16Conversion, FloatToBFloat16AndBack) {
    float in[100];
    for (int i = 0; i < 100; ++i) {
      in[i] = i + 1.25;
    }

    c10::BFloat16 bfloats[100];
    float out[100];

    for (int i = 0; i < 100; ++i) {
      bfloats[i].x = c10::detail::bits_from_f32(in[i]);
      out[i] = c10::detail::f32_from_bits(bfloats[i].x);

      // The relative error should be less than 1/(2^7) since BFloat16
      // has 7 bits mantissa.
      EXPECT_LE(fabs(out[i] - in[i]) / in[i], 1.0 / 128);
    }
  }

  TEST(BFloat16Conversion, NaN) {
    float inNaN = float_from_bytes(0, 0xFF, 0x7FFFFF);
    EXPECT_TRUE(std::isnan(inNaN));

    c10::BFloat16 a = c10::BFloat16(inNaN);
    float out = c10::detail::f32_from_bits(a.x);

    EXPECT_TRUE(std::isnan(out));
  }

  TEST(BFloat16Conversion, Inf) {
    float inInf = float_from_bytes(0, 0xFF, 0);
    EXPECT_TRUE(std::isinf(inInf));

    c10::BFloat16 a = c10::BFloat16(inInf);
    float out = c10::detail::f32_from_bits(a.x);

    EXPECT_TRUE(std::isinf(out));
  }

  TEST(BFloat16Conversion, SmallestDenormal) {
    float in =  std::numeric_limits<float>::denorm_min(); // The smallest non-zero subnormal number
    c10::BFloat16 a = c10::BFloat16(in);
    float out = c10::detail::f32_from_bits(a.x);

    EXPECT_FLOAT_EQ(in, out);
  }
} // namespace
Intoducing bfloat16 type (#21522) Summary: Pull Request resolved: https://github.com/pytorch/pytorch/pull/21522 ghimport-source-id: 4803f197ec04938501fdb10c1741280331c349d2 Test Plan: Imported from OSS Differential Revision: D15819369 Pulled By: izdeby fbshipit-source-id: 46408dc316a5c4dc644a736dc42da2422b34bcb9 2019-07-10 04:10:49 +00:00			`#include <c10/util/BFloat16.h>`
			`#include <gtest/gtest.h>`

			`namespace {`
			`float float_from_bytes(`
			`uint32_t sign,`
			`uint32_t exponent,`
			`uint32_t fraction`
			`) {`
			`uint32_t bytes;`
			`bytes = 0;`
			`bytes \|= sign;`
			`bytes <<= 8;`
			`bytes \|= exponent;`
			`bytes <<= 23;`
			`bytes \|= fraction;`

			`float res;`
			`std::memcpy(&res, &bytes, sizeof(res));`
			`return res;`
			`}`

			`TEST(BFloat16Conversion, FloatToBFloat16AndBack) {`
			`float in[100];`
			`for (int i = 0; i < 100; ++i) {`
			`in[i] = i + 1.25;`
			`}`

			`c10::BFloat16 bfloats[100];`
			`float out[100];`

			`for (int i = 0; i < 100; ++i) {`
			`bfloats[i].x = c10::detail::bits_from_f32(in[i]);`
			`out[i] = c10::detail::f32_from_bits(bfloats[i].x);`

Enabled BFloat16 storage (#21523) Summary: Pull Request resolved: https://github.com/pytorch/pytorch/pull/21523 ghimport-source-id: 698b3cbd6b21c09b9ff8bf8011980df8e35c33b0 Test Plan: Imported from OSS Differential Revision: D15819368 Pulled By: izdeby fbshipit-source-id: f6b3bba7b3ca8ee677bd80a231dbb3920c07d61c 2019-07-10 04:47:47 +00:00			`// The relative error should be less than 1/(2^7) since BFloat16`
Intoducing bfloat16 type (#21522) Summary: Pull Request resolved: https://github.com/pytorch/pytorch/pull/21522 ghimport-source-id: 4803f197ec04938501fdb10c1741280331c349d2 Test Plan: Imported from OSS Differential Revision: D15819369 Pulled By: izdeby fbshipit-source-id: 46408dc316a5c4dc644a736dc42da2422b34bcb9 2019-07-10 04:10:49 +00:00			`// has 7 bits mantissa.`
			`EXPECT_LE(fabs(out[i] - in[i]) / in[i], 1.0 / 128);`
			`}`
			`}`

			`TEST(BFloat16Conversion, NaN) {`
			`float inNaN = float_from_bytes(0, 0xFF, 0x7FFFFF);`
			`EXPECT_TRUE(std::isnan(inNaN));`

			`c10::BFloat16 a = c10::BFloat16(inNaN);`
			`float out = c10::detail::f32_from_bits(a.x);`

			`EXPECT_TRUE(std::isnan(out));`
			`}`

			`TEST(BFloat16Conversion, Inf) {`
			`float inInf = float_from_bytes(0, 0xFF, 0);`
			`EXPECT_TRUE(std::isinf(inInf));`

			`c10::BFloat16 a = c10::BFloat16(inInf);`
			`float out = c10::detail::f32_from_bits(a.x);`

			`EXPECT_TRUE(std::isinf(out));`
			`}`

			`TEST(BFloat16Conversion, SmallestDenormal) {`
			`float in = std::numeric_limits<float>::denorm_min(); // The smallest non-zero subnormal number`
			`c10::BFloat16 a = c10::BFloat16(in);`
			`float out = c10::detail::f32_from_bits(a.x);`

			`EXPECT_FLOAT_EQ(in, out);`
			`}`
			`} // namespace`