Panda3DS/include/align.hpp

// SPDX-FileCopyrightText: 2019-2022 Connor McLaughlin <stenzek@gmail.com>
// SPDX-License-Identifier: (GPL-3.0 OR CC-BY-NC-ND-4.0)

#pragma once

#include <cstdlib>

#include "helpers.hpp"

#ifdef _MSC_VER
#include <malloc.h>
#endif

namespace Common {
	template <typename T>
	constexpr bool isAligned(T value, unsigned int alignment) {
		return (value % static_cast<T>(alignment)) == 0;
	}

	template <typename T>
	constexpr T alignUp(T value, unsigned int alignment) {
		return (value + static_cast<T>(alignment - 1)) / static_cast<T>(alignment) * static_cast<T>(alignment);
	}

	template <typename T>
	constexpr T alignDown(T value, unsigned int alignment) {
		return value / static_cast<T>(alignment) * static_cast<T>(alignment);
	}

	template <typename T>
	constexpr bool isAlignedPow2(T value, unsigned int alignment) {
		return (value & static_cast<T>(alignment - 1)) == 0;
	}

	template <typename T>
	constexpr T alignUpPow2(T value, unsigned int alignment) {
		return (value + static_cast<T>(alignment - 1)) & static_cast<T>(~static_cast<T>(alignment - 1));
	}

	template <typename T>
	constexpr T alignDownPow2(T value, unsigned int alignment) {
		return value & static_cast<T>(~static_cast<T>(alignment - 1));
	}

	template <typename T>
	constexpr bool isPow2(T value) {
		return (value & (value - 1)) == 0;
	}

	template <typename T>
	constexpr T previousPow2(T value) {
		if (value == static_cast<T>(0)) return 0;

		value |= (value >> 1);
		value |= (value >> 2);
		value |= (value >> 4);
		if constexpr (sizeof(T) >= 16) value |= (value >> 8);
		if constexpr (sizeof(T) >= 32) value |= (value >> 16);
		if constexpr (sizeof(T) >= 64) value |= (value >> 32);
		return value - (value >> 1);
	}

	template <typename T>
	constexpr T nextPow2(T value) {
		// https://graphics.stanford.edu/~seander/bithacks.html#RoundUpPowerOf2
		if (value == static_cast<T>(0)) return 0;

		value--;
		value |= (value >> 1);
		value |= (value >> 2);
		value |= (value >> 4);
		if constexpr (sizeof(T) >= 16) value |= (value >> 8);
		if constexpr (sizeof(T) >= 32) value |= (value >> 16);
		if constexpr (sizeof(T) >= 64) value |= (value >> 32);
		value++;
		return value;
	}

	ALWAYS_INLINE static void* alignedMalloc(size_t size, size_t alignment) {
#ifdef _MSC_VER
		return _aligned_malloc(size, alignment);
#else
		// Unaligned sizes are slow on macOS.
#ifdef __APPLE__
		if (isPow2(alignment)) size = (size + alignment - 1) & ~(alignment - 1);
#endif
		void* ret = nullptr;
		return (posix_memalign(&ret, alignment, size) == 0) ? ret : nullptr;
#endif
	}

	ALWAYS_INLINE static void alignedFree(void* ptr) {
#ifdef _MSC_VER
		_aligned_free(ptr);
#else
		free(ptr);
#endif
	}
}  // namespace Common