Идентификаторы и ключевые слова
Идентификатор (в дальнейшем, для краткости - ID) – это имя программного объекта (константы, переменной, метки, типа, функции, модуля, поля в структуре). В идентификаторе могут использоваться латинские буквы, цифры и знак подчеркивания; первым символом ID может быть буква или знак подчеркивания, но не цифра; пробелы внутри ID не допускаются.
Длина идентификатора определяется реализацией (версией) транслятора Cи и редактора связей (компоновщика). Современная тенденция - снятие ограничений длины идентификатора.
При именовании объектов следует придерживаться общепринятых соглашений:
- ID переменной обычно пишется строчными буквами, например index (для сравнения: Index – это ID типа или функции, а INDEX – константа);
- идентификатор должен нести какой-либо смысл, поясняя назначение объекта в программе, например birth_date (день рождения) или sum (сумма);
- если ID состоит из нескольких слов, как, например birth_date, то принято либо разделять слова символом подчеркивания (birth_date), либо писать каждое следующее слово с большой буквы (birthDate).
Разделители идентификаторов объектов:
- пробелы;
- символы табуляции, перевода строки и страницы;
- комментарии (играют роль пробелов).
Наличие разделителей не влияет на работу программы.
В Си прописные и строчные буквы – различные символы. Идентификаторы Name, NAME, name – различные объекты.
Ключевые (зарезервированные) слова не могут быть использованы в качестве идентификаторов.
Ключевые слова Си:
auto | break | case | char |
const | continue | default | do |
double | else | enum | extern |
float | for | goto | if |
int | long | register | return |
short | signed | sizeof | static |
struct | switch | typedef | union |
unsigned | void | volatile | while |
Знаки операций
Знак операции – это один или более символов, определяющих действие над операндами. Внутри знака операции пробелы не допускаются. Операции делятся на унарные, бинарные и тернарные операции, по количеству участвующих в них операндов.
Литералы (константы)
Когда в программе встречается некоторое число, например 1, то это число называется литералом или литеральной константой. Константой, потому что мы не можем изменить его значение, и литералом, потому что буквально передает свое значение (от латинского literal – буквальный).
Литерал является неадресуемой величиной: хотя реально он, конечно, хранится в памяти машины, нет никакого способа узнать его адрес. Каждый литерал имеет определенный тип.
Комментарии
Еще один базовый элемент языка программирования – комментарий, – не является лексемой. Внутри комментария можно использовать любые допустимые на данном компьютере символы, а не только символы из алфавита языка программирования, поскольку компилятор комментарии игнорирует.
В Си комментарии ограничиваются парами символов /* и */, а в С++ был введен вариант комментария, который начинается символами // и заканчивается символом перехода на новую строку.
Базовые типы объектов
Простейшая программа
Программа написанная на языке Си состоит из одной или нескольких функций, причем одна функция обязательна имеет идентификатор (имя) main() – основная, главная. Ее назначение – управление всей работой программы (проекта). Данная функция, как правило, не имеет параметров и не возвращает результат, но наличие круглых скобок (как и для других функций без параметров) обязательно.
Общая структура программы на языке Си имеет вид:
<директивы препроцессора>
<определение типов пользователя – typedef>
<описание прототипов функций>
<определение глобальных переменных>
<функции>
В свою очередь, функции имеют такую структуру:
<класс памяти> <тип> < ID функции> (<объявление параметров>)
{ - начало функции
код функции
} - конец функции
Рассмотрим кратко основные части общей структуры программ.
Перед компиляцией программа на языке Си обрабатывается специальной программой – препроцессором, который работает под управлением директив.
Препроцессорные директивы начинаются с символа #, за которым следует наименование директивы, указывающее текущую операцию препроцессора.
Препроцессор решает ряд задач по предварительной обработке программы, основной из которых является «подключение» к программе так называемых заголовочных файлов (обычных текстов) с декларацией стандартных библиотечных функций, которые используются в программе. Наименование такой директивы: include (подключить), а общий формат ее использования:
#include < ID_файла.h>
где «h» – расширение заголовочных файлов.
Если идентификатор файла заключен в угловые скобки (< >), то поиск данного файла производится в стандартной директории с этими файлами, если же ID файла заключено в двойные кавычки (” ”), то поиск данного файла производится в текущей директории.
К наиболее часто используемым библиотекам относятся:
stdio.h - содержит стандартные функции файлового ввода-вывода;
conio.h - функции для работы с консолью (клавиатура, экран монитора);
math.h - математические функции.
Второе основное назначение препроцессора – это обработка макроопределений. Макроподстановка define (определить) имеет общий вид:
#define < ID > <строка>
Например: #define PI 3.1415927
В ходе препроцессорной обработки программы появление в тексте идентификатора PI везде заменяется значением 3.1415927.
Основные возможности препроцессора приведены в Приложении 3.
Рассмотрим небольшой пример, позволяющий понять самые простейшие приемы программирования на языке Си:
#include <stdio.h>
void main(void)
{ // Начало функции main
printf(“ Высшая оценка знаний - 10 !”);
} // Окончание функции main
Отличительным признаком функции служат круглые скобки ( ) после идентификатора функции, в которые заключается список аргументов. Если аргументы отсутствуют, указывают атрибут void - отсутствие значения. Перед ID функции обычно указывается тип возвращаемого ею результата, так как функция main() ничего не возвращает - в качестве результата указывается void.
Код функции представляет собой набор инструкций, каждая из которых оканчивается символом «;». В нашем примере одна инструкция - функция printf() выполняет форматный вывод данных на экран, в данном случае, указанную фразу.
Основные типы данных
Данные в языке Си разделяются на две категории: простые (скалярные), будем их называть базовыми, и сложные (составные) типы данных.
Основные типы базовых данных: стандартный целый (int), вещественный с одинарной точностью (float) и символьный (char).
В свою очередь, данные целого типа могут быть короткими (short), длинными (long), и без знаковыми (unsigned), а вещественные - с удвоенной точностью (double).
Сложные типы – массивы, структуры (struct), объединения или смеси (union), перечисление (enum).
Данные целого и вещественного типов находятся в определенных числовых диапазонах так как занимают разный объем оперативной памяти:
Таблица 1
Тип данных | Объем памяти (байт) | Диапазон значений |
сhar | -128 …127 | |
int | -32768…32767 | |
short | 2(1) | -32768…32767(-128…127) |
long | -2147483648…2147483647 | |
unsigned int | 0…65535 | |
unsigned long | 0…4294967295 | |
float | 3,14*10-38…3,14*1038 | |
double | 1,7 *10-308 1,7 *10308 |
4.3. Декларация (объявление) объектов
Все объекты, с которыми работает программа в Си необходимо декларировать, т.е. объявить компилятору об их присутствии в программе. При этом возможны две формы декларации:
- описание, не приводящее к выделению памяти;
- определение, при котором под объект будет выделен объем оперативной памяти, в соответствии с его типом; в этом случае объект можно сразу инициализировать, т.е. задать его начальное значение.
Кроме констант, которые можно задавать в исходном тексте, все объекты программы должны быть явно декларированы по следующему формату:
<атрибуты> <список ID объектов>;
элементы списка разделяются запятыми, а атрибуты - разделителями. Например: int i,j,k; float a,b;
Объекты программы в общем случае имеют следующие атрибуты:
<класс памяти> - характеристика способа размещения объектов в памяти (статическая, динамическая), определяет область видимости и время жизни переменной (по умолчанию - auto), данные атрибуты будут рассмотрены позже;
<тип> - характеристика механизма интерпретации данных, т.е. это совокупность информации о том, сколько объекту нужно выделить памяти, какой вид имеет представление информации и какие действия над ней допустимы (по умолчанию - int).
Класс памяти и тип – атрибуты необязательные и могут отсутствовать, тогда их значения установятся по умолчанию.
Примеры декларации простых объектов:
int i,j,k;
char r;
double gfd;
Рассмотрим основные базовые типы данных более подробно.
4.4. Данные целого типа (int)
Тип int - целое число, обычно соответствующее естественному размеру целых в используемой ЭВМ. Квалификаторы short и long, которые можно использовать с типом int, указывают на различные размеры целых, т.е. определяют размер памяти, выделяемый под переменные (табл.1).
Примеры: short int x;
long int x;
unsigned int x = 8; (декларация с одновременной инициализацией числом 8).
Атрибут int в таких ситуациях может быть опущен.
Атрибуты signed и unsigned показывают, как интерпретируется старший бит числа, как знак или как часть числа:
int | Знак | Значение числа | |
14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 | - номера битов |
unsigned int | Значение числа |
15 0 |
long | Знак | Значение числа |
30 0 |
unsigned long | Значение числа |
31 0 |
Если указан только атрибут int, это означает - short signed int.
4.5. Данные символьного типа (char)
Символьная переменная занимает в памяти 1 байт и представляется кодом от 0 до 255. Закрепление конкретных символов за кодами производится кодовыми таблицами.
Для персональных компьютеров наиболее распространена ASCII (American Standard Code for Information Interchenge) таблица кодов (Приложение 1). Данные типа char рассматриваются компилятором как "целые", поэтому возможно использование signed char (по умолчанию) - символы с кодами от -128 до +127 (т.е. только символы с кодами до 127) и unsigned char - символы с кодами от 0 до 255 (в том числе и русские).
Примеры:
char res, simv1, simv2;
char let = 's'; (декларация с одновременной инициализацией символом s).
4.6. Данные вещественного типа (float, double)
Данные вещественного типа в памяти занимают, соответственно, float - 4 байта; double - 8 байт; long double (повышенная точность) - 10 байт. Для размещения данных типа float обычно 8 бит выделено для представления порядка и знака и 24 бита под мантиссу.
Тип | Точность (мантисса) | Порядок |
float | 7 цифр после запятой | ± 38 |
double | ± 308 | |
Long double | ± 4932 |