locale(7) описание поддержки нескольких языков

ОБЗОР


#include <locale.h>

ОПИСАНИЕ

Локаль — это сочетание языковых и культурных аспектов. Они включают в себя: язык сообщений, различные наборы символов, лексикографические соглашения и т.п. Программа должна определять локализацию и действовать согласно её установкам в целях достижения взаимосвязи различных культур.

Файл <locale.h> описывает типы данных, функции и макросы, необходимые для выполнения этой задачи.

В нём описаны функции: setlocale(3), устанавливающая текущую локаль и localeconv(3), которая возвращает информацию о форматировании чисел.

Существуют различные категории информации в локали, которые программа может использовать; они описаны как макросы. Используя их в качестве первого аргумента функции setlocale(3), можно установить значение значение категории в желаемой локали:

LC_ADDRESS (расширение GNU, начиная с glibc 2.2)
Изменяет настройки, которые описывают форматы (например, почтовый адрес), используемые для описания местонахождения и географических объектов. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_ADDRESS_COUNTRY_NAME (название страны на языке локали) и _NL_ADDRESS_LANG_NAME (название языка на языке локали), которая возвращает строку, например «Deutschland» и «Deutsch» (для локалей с немецким языком) (остальные названия элементов перечислены в <langinfo.h>).
LC_COLLATE
Эта категория определяет правила сравнения, используемые при сортировке и регулярных выражениях, включая равенство классов символов и сравнение многосимвольных элементов. Эта категория локали изменяет поведение функций strcoll(3) и strxfrm(3), которые используются для сравнения строк с учётом местного алфавита. Например, немецкая эсцет (sharp s) рассматривается как «ss».
LC_CTYPE
Эта категория определяет интерпретацию последовательности байт в символы (например, одиночный или многобайтовый символ), классификацию символов (например, буквенный или цифровой) и поведение классов символов. В системах с glibc эта категория также определяет правила транслитерации символов для iconv(1) и iconv(3). Она изменяет поведение функций обработки и классификации символов, таких как isupper(3) и toupper(3), а также многобайтных символьных функций, таких как mblen(3) или wctomb(3).
LC_IDENTIFICATION (расширение GNU, начиная с glibc 2.2)
Изменяет настройки, которые относятся к метаданным локали. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_IDENTIFICATION_TITLE (заголовок данной локали) и _NL_IDENTIFICATION_TERRITORY (географическое расположение, для которой создавалась локаль), которая возвращает строку, например «English locale for the USA» и «USA» (остальные названия элементов перечислены в <langinfo.h>).
LC_MONETARY
Эта категория определяет форматирования, используемое для денежных значений. Она изменяет информацию, возвращаемую функцией localeconv(3) , которая описывает способ отображения числа, например, необходимо ли использовать в качестве десятичного разделителя точку или запятую. Эта информация используется в функции strfmon(3).
LC_MESSAGES
Эта категория изменяет язык отображаемых сообщений и указывает, как должны выглядеть положительный и отрицательный ответы. Библиотека GNU C содержит функции gettext(3), ngettext(3) и rpmatch(3) для более удобного использования этой информации. Семейство функций GNU gettext так же учитывает переменную окружения LANGUAGE (содержащую через двоеточие список локалей), если указана допустимая локаль, отличная от "C". Данная категория также влияет на поведение catopen(3).
LC_MEASUREMENT (расширение GNU, начиная с glibc 2.2)
Изменяет настройки, которые в локали описывают систему мер (то есть, метрическую систему мер и систему мер США (US customary unit)). Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартного элемента _NL_MEASUREMENT_MEASUREMENT, которая возвращает 1 (метрическая) или 2 (система мер США).
LC_NAME (расширение GNU, начиная с glibc 2.2)
Изменяет настройки, которые описывают форматы, используемые для описания персон. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_NAME_NAME_MR (приветствие мужчин) и _NL_NAME_NAME_MS (приветствие женщин), которая возвращает строку, например «Herr» и «Frau» (для локалей с немецким языком) (остальные названия элементов перечислены в <langinfo.h>).
LC_NUMERIC
Эта категория определяет правила форматирования, используемые для не денежных значений; например, разделительный символ тысяч и дробной части (точка в англоязычных странах, и запятая во многих других). Она влияет на поведение функций printf(3), scanf(3) и strtod(3). Эта информация может быть также прочитана при помощи функции localeconv(3).
LC_PAPER (расширение GNU, начиная с glibc 2.2)
Изменяет настройки, которые относятся к размерам стандартных листов бумаги (например, письмо США и A4). Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_PAPER_WIDTH и _NL_PAPER_HEIGHT которая возвращает значение int, определяющее размер в миллиметрах.
LC_TELEPHONE (расширение GNU, начиная с glibc 2.2)
Изменяет настройки, которые описывают форматы, используемые службах телефонии. Приложения, в которых требуется эта информация, могут использовать функцию nl_langinfo(3) для получения нестандартных элементов, таких как _NL_TELEPHONE_INT_PREFIX (международный префикс, используемые для номеров звонков в этой локали), которая возвращает строку, например «49» (для Германии) (остальные названия элементов перечислены в <langinfo.h>).
LC_TIME
Эта категория управляет форматированием значений даты и времени. Например, большая часть Европы использует 24-часовой формат, тогда как в США используют 12-часовой.Значение этой категории влияет на поведение функции strftime(3) и strptime(3).
LC_ALL
Всё вышеперечисленное.

Если второй аргумент функции setlocale(3) равен пустой строке "", то локаль по умолчанию будет определяться следующим образом:

1.
Если существует непустая переменная окружения LC_ALL, то используется её значение.
2.
Если существует переменная окружения с именем одной из вышеописанных категорий и она непустая, то её значение присваивается этой категории.
3.
Если существует непустая переменная окружения LANG, то используется её значение.

Информация о локальном форматировании чисел доступна в структуре struct lconv, возвращаемой функцией localeconv(3) , которая описана следующим образом:

struct lconv {
    /* Информация о числах (не связанная с деньгами) */
    char *decimal_point;     /* Символ разделителя дробной части */
    char *thousands_sep;     /* Разделитель групп цифр слева от
                                символа разделителя дробной части */
    char *grouping; /* Каждый элемент является номером цифры в группе;
                       элементы c большими номерами находятся левее.
                       Элемент с значением CHAR_MAX означает, что
                       группировка завершена. Элемент со значением 0
                       указывает, что предыдущий элемент используется
                       для всех групп, находящихся левее. */
    /* В оставшихся полях указывается информация о денежных
       величинах */
    char *int_curr_symbol;   /* Первые три символа являются символом
                                валюты, согласно ISO 4217. Четвёртый
                                символ является разделителем. Пятый
                                символ равен '\0'. */
    char *currency_symbol;   /* Местный символ валюты */
    char *mon_decimal_point; /* Символ разделителя дробной части */
    char *mon_thousands_sep; /* Как thousands_sep */
    char *mon_grouping;      /* Как grouping */
    char *positive_sign;     /* Знак положительных значений */
    char *negative_sign;     /* Знак отрицательных значений */
    char  int_frac_digits;   /* Представление дробных чисел в
                                международном формате */
    char  frac_digits;       /* Представление дробных чисел в локальном
                                формате */
    char  p_cs_precedes;     /* 1, если символ валюты указывается перед
                                положительным значение, 0 — если
                                следует за ним. */
    char  p_sep_by_space;    /* 1, если пробел отделяет символ валюты
                                от положительного значения */
    char  n_cs_precedes;     /* 1, если символ валюты предшествует
                                 отрицательному значению,
                                0, если следует за ним */
    char  n_sep_by_space;    /* 1, если пробел отделяет символ валюты
                                от отрицательного значения */
    /* Позиция положительного или отрицательного знака:
       0 Скобки окружают количество и символ валюты.
       1 Знак предшествует количеству и символу валюты.
       2 Знак следует за количеством и символом валюты.
       3 Знак непосредственно предшествует символу валюты.
       4 Знак непосредственно следует за символом валюты. */
    char  p_sign_posn;
    char  n_sign_posn;
};

Расширения POSIX.1-2008 программного интерфейса локали

В POSIX.1-2008 стандартизовано несколько расширений программного интерфейса локали на основе реализаций, которые впервые появились в версии 2.3 библиотеки GNU C. Эти расширения разработаны для решения проблем, возникающих у обычного программного интерфейса локали в многонитевых приложениях и приложениях, которые должны работать с несколькими локалями.

Расширения представляют новые функции для создания и управления объектами локали (newlocale(3), freelocale(3), duplocale(3) и uselocale(3)) и различные новые библиотечные функции с суффиксом«_l» (например, toupper_l(3)), которые расширяют обычный зависящий от локали программный интерфейс (например, toupper(3)) так, что позволяют указать объект локали, который будет использован при работе функции.

ОКРУЖЕНИЕ

Следующая переменная окружения используется в newlocale(3) и setlocale(3), и поэтому влияет на все не привилегированные локализованные программы:
LOCPATH
Список путей, разделённых двоеточием («:»), который должен использоваться при поиске данных локали. Если переменная установлена, то используются только скомпилированные файлы данных одной локали из LOCPATH и путь к данным системной локали по умолчанию; все другие доступные архивы локалей не используются (смотрите localedef(1)). Скопированные файлы данных одной локали ищутся в подкаталогах, которые зависят от используемой локали в данный момент. Например, если для категории используется en_GB.UTF-8, то будут просмотрены следующие подкаталоги в таком порядке: en_GB.UTF-8, en_GB.utf8, en_GB, en.UTF-8, en.utf8 и en.

ФАЙЛЫ

/usr/lib/locale/locale-archive
Обычный путь по умолчанию для расположения архива локалей.
/usr/lib/locale
Обычный путь по умолчанию для скомпонованных файлов отдельных локалей.

СООТВЕТСТВИЕ СТАНДАРТАМ

POSIX.1-2001.