Шпаргалка: 2025

вторник, 14 октября 2025 г.

Особенности cmake в Visual Studio 2022

Во время отладки кода из hackerrank, наткнулся на такую проблему, что он не компилируется, если вместо "классического" способа создания проекта (sln- и vcxproj-файлы) создавать его с помощью cmake и CMakeLists.txt. Вот такие сообщения получаю 'not1': identifier not found:

Зайдя определение функций not1, ptr_fn, видим, что они "_cxx17_deprecate"

Теперь идем и видим вот такое в CMakelists.txt:

if (CMAKE_VERSION VERSION_GREATER 3.12) set_property(TARGET QueriesWithFixedLength PROPERTY CXX_STANDARD 20) endif()

То есть, если версия cmake новее, чем 3.12, то надо использовать C++20. Проверим версию cmake, используя Visual Studio 2022 command prompt, используя команду cmake --version:

Как видим, у нас версия 3.31. Не заморачиваясь с тем, какая версия C++ будет использоваться по умолчанию, если удалить эту директиву, мы просто поменяем версию на C++14:

if (CMAKE_VERSION VERSION_GREATER 3.12) set_property(TARGET QueriesWithFixedLength PROPERTY CXX_STANDARD 14) endif()

После этого все скомпилировалось.

Еще добавил эту строчку:

file(COPY "${CMAKE_CURRENT_SOURCE_DIR}/input01.txt" DESTINATION "${CMAKE_CURRENT_BINARY_DIR}")

потому что без нее не считывало входные файлы ("старым" методом все работало и так).

воскресенье, 20 июля 2025 г.

Новые возможности C++20: std::execution::par

Поспрашивал тут у ChatGPT что нового у мире C++ и тут завезли очень классную штуку: std::execution::par. Никак не напрягаясь дополнительно, мы просто делаем тот же самый sort, но благодаря дополнительному параметру он сам распарралеливает все на несколько ядер/потоков. Тот же ЧатЖПТ сам мне дал код примера, который отлично скомпилировался в моей Visual Studio 2022:

#include <execution> // параллельные политики #include <algorithm> // std::sort #include <vector> #include <random> #include <chrono> #include <iostream> int main() { const size_t N = 5'000'000; // Количество элементов // --- 1. Генерация случайных данных --- std::vector<int> data(N); std::mt19937 rng(42); std::uniform_int_distribution<int> dist(0, 1'000'000); std::generate(data.begin(), data.end(), [&] { return dist(rng); }); // Создаём копии для честного сравнения auto data_seq = data; auto data_par = data; // --- 2. Последовательная сортировка --- auto t1 = std::chrono::high_resolution_clock::now(); std::sort(data_seq.begin(), data_seq.end()); auto t2 = std::chrono::high_resolution_clock::now(); std::cout << "std::sort (seq): " << std::chrono::duration<double>(t2 - t1).count() << " s\n"; // --- 3. Параллельная сортировка --- auto t3 = std::chrono::high_resolution_clock::now(); std::sort(std::execution::par, data_par.begin(), data_par.end()); auto t4 = std::chrono::high_resolution_clock::now(); std::cout << "std::sort (par): " << std::chrono::duration<double>(t4 - t3).count() << " s\n"; // --- 4. Проверка корректности --- std::cout << "First elements: seq=" << data_seq[0] << ", par=" << data_par[0] << "\n"; return 0; }

Результаты такие:

std::sort (seq): 0.371002 s

std::sort (par): 0.0917933 s

Запущено на AMD Ryzen 7 7730U (8c/16t).

Нуу, очень неплохо: добавлением всего одного параметра увеличиваем скорость в 4 раза!

Чтобы это работало, надо не забыть оказать версию C++ в Visual Studio:

четверг, 19 июня 2025 г.

OpenCL: добавление поддержки видеокарт AMD в CMakeLists.txt

Вот этот пример мы модифицируем так, чтобы он мог компилироваться для AMD видеокарт тоже. CMakeLists.txt получился вот такой:

#
cmake_minimum_required (VERSION 3.8)
project ("MemakePrj")
# Add source to this project's executable.
add_executable (MemakePrj "main.cpp" "Memake/Memake.cpp" "Memake/Vector2d.cpp")
# SDL2 headers
target_include_directories(MemakePrj PRIVATE "SDL2-2.0.14/include")
# gpu vendor: amd, nvidia
set(gpu_vendor "amd")
#
if("${gpu_vendor}" STREQUAL "amd")
message("gpu_vendor is 'amd'")
# set define
target_compile_definitions(MemakePrj PUBLIC GPU_VENDOR_IS_AMD)
# OpenCL library
set(opencl_lib_folder "$ENV{OCL_ROOT}/lib")
# OpenCL headers
target_include_directories(MemakePrj PRIVATE "$ENV{OCL_ROOT}/include")
elseif("${gpu_vendor}" STREQUAL "nvidia")
message("gpu_vendor is 'nvidia'")
# set define
target_compile_definitions(MemakePrj PUBLIC GPU_VENDOR_IS_NVIDIA)
# OpencCL headers
target_include_directories(MemakePrj PRIVATE "$ENV{CUDA_PATH}/include")
# OpenCL library
set(opencl_lib_folder "$ENV{CUDA_PATH}/lib")
else()
message("gpu_vendor is 'UNKNOWN'")
endif()
# add SDL_MAIN_HANDLED definition to avoid
# "LNK2019 unresolved external symbol SDL_main referenced in function main_getcmdline"
add_definitions( -DSDL_MAIN_HANDLED )
# SDL library folder
set(SDL2_lib_folder "${PROJECT_SOURCE_DIR}/SDL2-2.0.14/lib")
message(${CMAKE_BUILD_TYPE})
# check 32 or 64 bits
if(CMAKE_SIZEOF_VOID_P EQUAL 8)
# 64 bits
set(SDL2_lib_folder "${SDL2_lib_folder}/x64")
if("${gpu_vendor}" STREQUAL "amd")
set(opencl_lib_folder "${opencl_lib_folder}")
elseif("${gpu_vendor}" STREQUAL "nvidia")
set(opencl_lib_folder "${opencl_lib_folder}/x64")
else()
message("gpu_vendor is 'UNKNOWN'")
endif()
elseif(CMAKE_SIZEOF_VOID_P EQUAL 4)
# 32 bits
set(SDL2_lib_folder "${SDL2_lib_folder}/x86")
if("${gpu_vendor}" STREQUAL "amd")
message("do not want to support 32-bit version for amd")
elseif("${gpu_vendor}" STREQUAL "nvidia")
set(opencl_lib_folder "${opencl_lib_folder}/Win32")
else()
message("gpu_vendor is 'UNKNOWN'")
endif()
endif()
# link SDL2 static lib
target_link_libraries(MemakePrj ${SDL2_lib_folder}/SDL2.lib)
target_link_libraries(MemakePrj ${SDL2_lib_folder}/SDL2main.lib)
# link OpenCL library
target_link_libraries(MemakePrj ${opencl_lib_folder}/OpenCL.lib)
# copy dynamic lib to folder with executable file
file(COPY ${SDL2_lib_folder}/SDL2.dll DESTINATION ${PROJECT_BINARY_DIR})

Получилось гораздо более громоздко и неудобочитаемо, чем было. В строке 12 мы указываем, какой у нас производитель видеокарты (пока что их два: AMD, Nvidia) IF внутри IF - это не то, что способствует облегчению чтения подобного кода, но это, тем не менее, позволяет собрать проект для двух и более производителей видеокарт, а это главное. Позже подумаю, как правильно разбить CMakeLists.txt на части.

В коде же это выглядит так:

вторник, 17 июня 2025 г.

Настройка OpenCL для видеокарт AMD

Прежде, чем начать, отмечу, что компания AMD на данный момент не поддерживает свой OpenCL SDK, к сожалению. Причины мне непонятны, хотя они предлагают вместо него какой-то свой собственный аналог CUDA у NVidia. Последним, к слову, наличие CUDA никак не помешало поддерживать тот же OpenCL. Такое отношение к OpenCL не может радовать, конечно же. Тот набор инструментов, что используется ниже - он поддерживается энтузиастами (за что им огромное спасибо).

Скачать SDK можно, например, тут. После установки, установим переменную окружения OCL_ROOT и проверим, что она правильно установлена:

Далее все делаем так же, как мы делали раньше и в тех же местах.

Тут настройка среды закончена и для запуска примера осталось только чуть подредактировать код, вместо заголовка cl.hpp мы возьмем cl2.hpp и добавим определение CL_HPP_ENABLE_PROGRAM_CONSTRUCTION_FROM_ARRAY_COMPATIBILITY перед заголовочным файлом для совместимости со старым кодом:

После этого можно запустить пример и убедиться, что он работает:

Заодно проверим как работает перемножение матриц в наивной реализации для CPU и GPU:

Запускалалось на Ryzen 7 7730U with Vega 8 iGPU

Заодно сравним производительность ноутбучного процессора и встроенной видеокарты с результатами настольного ПК:

вторник, 14 октября 2025 г.