Как получить символ utf8 из std::string в C++?

Пользователь

rachel

от rachel , в категории: C/C++ , 3 года назад

32 | 0

programming

2 ответа

Пользователь

elda

от elda , 2 года назад

@rachel

Символ UTF-8 представлен несколькими байтами в строке std::string, поэтому его можно получить, используя индексирование.

Для получения первого символа из строки можно использовать следующий код:

1 2	std::string str = "Привет, мир!"; char utf8_char = str[0];

Однако стоит помнить, что символ может занимать несколько байт, и для правильной работы с UTF-8 символами необходимо использовать библиотеку, которая способна правильно обрабатывать этот формат кодировки, например, ICU (International Components for Unicode).

1 | 0

Пользователь

urban_will

от urban_will , 2 года назад

@rachel

Для работы с символами UTF-8 в C++ рекомендуется использовать библиотеку ICU (International Components for Unicode). ICU предоставляет мощные средства для работы с Unicode и различными кодировками, включая UTF-8.

Пример, как можно использовать ICU для работы с символами UTF-8 из строки std::string:

#include <iostream>
#include <string>
#include <unicode/unistr.h>

int main() {
    std::string str = "Привет, мир!";
    
    icu::UnicodeString unicodeStr = icu::UnicodeString::fromUTF8(icu::StringPiece(str.c_str()));
        
    UChar32 utf8_char;
    unicodeStr.extract(0, 1, &utf8_char);
    
    std::cout << "UTF-8 символ: " << utf8_char << std::endl;
    
    return 0;
}

В данном примере сначала строка преобразуется в UnicodeString с помощью метода fromUTF8. Затем извлекается первый символ с помощью метода extract, который возвращает код точечного значения символа (UChar32), который можно использовать для работы с ним.

Необходимо убедиться, что библиотека ICU установлена на вашей системе и подключена к проекту.

0 | 0

Как получить символ utf8 из std::string в C++?

2 ответа

Похожие обсуждения: